Fix comment in run-deploy.sh
[arvados-dev.git] / jenkins / run-deploy.sh
1 #!/bin/bash
2
3 # Copyright (C) The Arvados Authors. All rights reserved.
4 #
5 # SPDX-License-Identifier: AGPL-3.0
6
7 DEBUG=0
8 SSH_PORT=22
9 PUPPET_CONCURRENCY=5
10
11 read -d] -r SCOPES <<EOF
12 --scopes
13 '["GET /arvados/v1/virtual_machines",\n
14 "GET /arvados/v1/keep_services",\n
15 "GET /arvados/v1/keep_services/",\n
16 "GET /arvados/v1/groups",\n
17 "GET /arvados/v1/groups/",\n
18 "GET /arvados/v1/links",\n
19 "GET /arvados/v1/collections",\n
20 "POST /arvados/v1/collections",\n
21 "POST /arvados/v1/links",\n
22 "GET /arvados/v1/users/current",\n
23 "POST /arvados/v1/users/current",\n
24 "GET /arvados/v1/jobs",\n
25 "POST /arvados/v1/jobs",\n
26 "GET /arvados/v1/pipeline_instances",\n
27 "POST /arvados/v1/pipeline_instances",\n
28 "PUT /arvados/v1/pipeline_instances/",\n
29 "GET /arvados/v1/collections/",\n
30 "POST /arvados/v1/collections/",\n
31 "GET /arvados/v1/logs"]'
32 EOF
33
34 function usage {
35     echo >&2
36     echo >&2 "usage: $0 [options] <identifier>"
37     echo >&2
38     echo >&2 "   <identifier>                 Arvados cluster name"
39     echo >&2
40     echo >&2 "$0 options:"
41     echo >&2 "  -n, --node <node>             Single machine to deploy, use fqdn, optional"
42     echo >&2 "  -p, --port <ssh port>         SSH port to use (default 22)"
43     echo >&2 "  -c, --concurrency <max>       Maximum concurrency for puppet runs (default 5)"
44     echo >&2 "  -d, --debug                   Enable debug output"
45     echo >&2 "  -h, --help                    Display this help and exit"
46     echo >&2
47     echo >&2 "Note: this script requires an arvados token created with these permissions:"
48     echo >&2 '  arv api_client_authorization create_system_auth \'
49     echo -e $SCOPES"]'" >&2
50     echo >&2
51 }
52
53
54 # NOTE: This requires GNU getopt (part of the util-linux package on Debian-based distros).
55 TEMP=`getopt -o hdp:c:n: \
56     --long help,debug,port:,concurrency:,node: \
57     -n "$0" -- "$@"`
58
59 if [ $? != 0 ] ; then echo "Use -h for help"; exit 1 ; fi
60 # Note the quotes around `$TEMP': they are essential!
61 eval set -- "$TEMP"
62
63 while [ $# -ge 1 ]
64 do
65     case $1 in
66         -n | --node)
67             NODE="$2"; shift 2
68             ;;
69         -p | --port)
70             SSH_PORT="$2"; shift 2
71             ;;
72         -c | --concurrency)
73             PUPPET_CONCURRENCY="$2"; shift 2
74             ;;
75         -d | --debug)
76             DEBUG=1
77             shift
78             ;;
79         --)
80             shift
81             break
82             ;;
83         *)
84             usage
85             exit 1
86             ;;
87     esac
88 done
89
90 IDENTIFIER=$1
91
92 if [[ "$IDENTIFIER" == '' ]]; then
93   usage
94   exit 1
95 fi
96
97 EXITCODE=0
98
99 COLUMNS=80
100
101 PUPPET_AGENT='
102 __rvm_unload
103 now() { date +%s; }
104 let endtime="$(now) + 600"
105 while [ "$endtime" -gt "$(now)" ]; do
106     puppet agent --test --detailed-exitcodes
107     agent_exitcode=$?
108     if [ 0 = "$agent_exitcode" ] || [ 2 = "$agent_exitcode" ]; then
109         break
110     else
111         sleep 10s
112     fi
113 done
114 exit ${agent_exitcode:-99}
115 '
116
117 title () {
118   date=`date +'%Y-%m-%d %H:%M:%S'`
119   printf "$date $1\n"
120 }
121
122 function run_puppet() {
123   node=$1
124
125   title "Running puppet on $node"
126   sleep $[ $RANDOM / 6000 ].$[ $RANDOM / 1000 ]
127   TMP_FILE=`mktemp`
128   if [[ "$DEBUG" != "0" ]]; then
129     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C bash -c "'$PUPPET_AGENT'" | tee $TMP_FILE
130   else
131     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C bash -c "'$PUPPET_AGENT'" > $TMP_FILE 2>&1
132   fi
133
134   ECODE=${PIPESTATUS[0]}
135   RESULT=$(cat $TMP_FILE)
136
137   if [[ "$ECODE" != "255" && ! ("$RESULT" =~ 'already in progress') && "$ECODE" != "2" && "$ECODE" != "0"  ]]; then
138     # Ssh exits 255 if the connection timed out. Just ignore that.
139     # Puppet exits 2 if there are changes. For real!
140     # Puppet prints 'Notice: Run of Puppet configuration client already in progress' if another puppet process
141     #   was already running
142     echo "ERROR running puppet on $node: exit code $ECODE"
143     if [[ "$DEBUG" == "0" ]]; then
144       title "Command output follows:"
145       echo $RESULT
146     fi
147   fi
148   if [[ "$ECODE" == "255" ]]; then
149     title "Connection timed out"
150     ECODE=0
151   fi
152   if [[ "$ECODE" == "2" ]]; then
153     ECODE=0
154   fi
155
156   if [[ "$ECODE" == "0" ]]; then
157       rm -f $TMP_FILE
158       echo $node successfully updates
159   else
160       echo $node exit code: $ECODE see $TMP_FILE for details
161   fi
162 }
163
164 function run_command() {
165   node=$1
166   return_var=$2
167   command=$3
168
169   title "Running '$command' on $node"
170   TMP_FILE=`mktemp`
171   if [[ "$DEBUG" != "0" ]]; then
172     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 125" root@$node -C "$command" | tee $TMP_FILE
173   else
174     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 125" root@$node -C "$command" > $TMP_FILE 2>&1
175   fi
176
177   ECODE=$?
178   RESULT=$(cat $TMP_FILE)
179
180   if [[ "$ECODE" != "255" && "$ECODE" != "0"  ]]; then
181     # Ssh exists 255 if the connection timed out. Just ignore that, it's possible that this node is
182     #   a shell node that is down.
183     title "ERROR running command on $node: exit code $ECODE"
184     if [[ "$DEBUG" == "0" ]]; then
185       title "Command output follows:"
186       echo $RESULT
187     fi
188   fi
189   if [[ "$ECODE" == "255" ]]; then
190     title "Connection timed out"
191     ECODE=0
192   fi
193   rm -f $TMP_FILE
194   eval "$return_var=$ECODE"
195 }
196
197 if [[ "$NODE" == "" ]] || [[ "$NODE" == "$IDENTIFIER.arvadosapi.com" ]]; then
198   title "Updating API server"
199   SUM_ECODE=0
200   run_puppet $IDENTIFIER.arvadosapi.com ECODE
201   SUM_ECODE=$(($SUM_ECODE + $ECODE))
202
203   if [[ "$SUM_ECODE" != "0" ]]; then
204     title "ERROR: Updating API server FAILED"
205     EXITCODE=$(($EXITCODE + $SUM_ECODE))
206     exit $EXITCODE
207   fi
208 fi
209
210 if [[ "$NODE" == "$IDENTIFIER.arvadosapi.com" ]]; then
211         # we are done
212         exit 0
213 fi
214
215 title "Loading ARVADOS_API_HOST and ARVADOS_API_TOKEN"
216 if [[ -f "$HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf" ]]; then
217   . $HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf
218 else
219   title "WARNING: $HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf not found."
220 fi
221 if [[ "$ARVADOS_API_HOST" == "" ]] || [[ "$ARVADOS_API_TOKEN" == "" ]]; then
222   title "ERROR: ARVADOS_API_HOST and/or ARVADOS_API_TOKEN environment variables are not set."
223   exit 1
224 fi
225
226 title "Gathering list of shell and Keep nodes"
227 SHELL_NODES=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv virtual_machine list |jq .items[].hostname -r`
228 KEEP_NODES=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv keep_service list |jq .items[].service_host -r`
229
230 nodes=""
231 for n in workbench manage switchyard $SHELL_NODES $KEEP_NODES; do
232   ECODE=0
233   if [[ $n =~ $ARVADOS_API_HOST$ ]]; then
234     # e.g. keep.qr1hi.arvadosapi.com
235     node=$n
236   else
237     # e.g. shell
238     node=$n.$ARVADOS_API_HOST
239   fi
240         if [[ "$NODE" == "" ]] || [[ "$NODE" == "$node" ]]; then
241           # e.g. keep.qr1hi
242           nodes="$nodes ${node%.arvadosapi.com}"
243         fi
244 done
245
246 if [[ "$nodes" != "" ]]; then
247   ## at this point nodes should be an array containing
248   ## manage.qr1hi,  keep.qr1hi, etc
249   ## that should be defined in the .ssh/config file
250   title "Updating in parallel: $nodes"
251   export -f run_puppet
252   export -f title
253   export SSH_PORT
254   export PUPPET_AGENT
255   echo $nodes|xargs -d " " -n 1 -P $PUPPET_CONCURRENCY -I {} bash -c "run_puppet {}"
256 fi
257
258 if [[ "$NODE" == "" ]]; then
259   title "Locating Arvados Standard Docker images project"
260
261   JSON_FILTER="[[\"name\", \"=\", \"Arvados Standard Docker Images\"], [\"owner_uuid\", \"=\", \"$IDENTIFIER-tpzed-000000000000000\"]]"
262   DOCKER_IMAGES_PROJECT=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv --format=uuid group list --filters="$JSON_FILTER"`
263
264   if [[ "$DOCKER_IMAGES_PROJECT" == "" ]]; then
265     title "Warning: Arvados Standard Docker Images project not found. Creating it."
266
267     DOCKER_IMAGES_PROJECT=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv --format=uuid group create --group "{\"owner_uuid\":\"$IDENTIFIER-tpzed-000000000000000\", \"name\":\"Arvados Standard Docker Images\", \"group_class\":\"project\"}"`
268     ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv link create --link "{\"tail_uuid\":\"$IDENTIFIER-j7d0g-fffffffffffffff\", \"head_uuid\":\"$DOCKER_IMAGES_PROJECT\", \"link_class\":\"permission\", \"name\":\"can_read\" }"
269     if [[ "$?" != "0" ]]; then
270       title "ERROR: could not create standard Docker images project Please create it, cf. http://doc.arvados.org/install/create-standard-objects.html"
271       exit 1
272     fi
273   fi
274
275   title "Found Arvados Standard Docker Images project with uuid $DOCKER_IMAGES_PROJECT"
276
277         # from 1.4 onwards, we use the python executable that is part of the python-arvados-cwl-runner package
278   GIT_COMMIT=`ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER "bash -s" <<EOF
279 if [[ -e "/usr/share/python2.7/dist/python-arvados-cwl-runner/bin/python" ]]; then
280   /usr/share/python2.7/dist/python-arvados-cwl-runner/bin/python -c 'import arvados_cwl ; print arvados_cwl.__version__'
281 else
282   /usr/bin/python -c 'import arvados_cwl ; print arvados_cwl.__version__'
283 fi
284 EOF
285 `
286
287   if [[ "$?" != "0" ]] || [[ "$GIT_COMMIT" == "" ]]; then
288     title "ERROR: unable to get arvados/jobs Docker image git revision"
289     exit 1
290   else
291     title "Found git commit for arvados/jobs Docker image: $GIT_COMMIT"
292   fi
293
294   run_command shell.$IDENTIFIER ECODE "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv-keepdocker" |grep -q $GIT_COMMIT
295
296   if [[ "$?" == "0" ]]; then
297     title "Found latest arvados/jobs Docker image, nothing to upload"
298     # Just in case it isn't yet, tag the image as latest
299     title "Tag arvados/jobs Docker image $GIT_COMMIT as latest"
300     ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv-keepdocker --project-uuid=$DOCKER_IMAGES_PROJECT arvados/jobs latest"
301   else
302     title "Installing latest arvados/jobs Docker image"
303     ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv-keepdocker --pull --project-uuid=$DOCKER_IMAGES_PROJECT arvados/jobs $GIT_COMMIT"
304     ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER docker tag --force >/dev/null 2>&1
305     # docker 1.13 no longer supports --force. Sigh.
306     if [[ "$?" == "125" ]]; then
307       FORCE_TAG=""
308     else
309       FORCE_TAG="--force"
310     fi
311     ## adding latest tag too  refs 9254
312     ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER docker tag $FORCE_TAG arvados/jobs:$GIT_COMMIT arvados/jobs:latest
313     ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv-keepdocker --project-uuid=$DOCKER_IMAGES_PROJECT arvados/jobs latest"
314     if [[ "$?" -ne 0 ]]; then
315       title "'arv-keepdocker' failed, exit code $?..."
316       exit 1
317     fi
318   fi
319 fi