refs #1572: commit not committed changes on ci server bringing up to date
[arvados-dev.git] / jenkins / run-deploy.sh
1 #!/bin/bash
2
3 # Copyright (C) The Arvados Authors. All rights reserved.
4 #
5 # SPDX-License-Identifier: AGPL-3.0
6
7 DEBUG=0
8 SSH_PORT=22
9 PUPPET_CONCURRENCY=5
10
11 read -d] -r SCOPES <<EOF
12 --scopes
13 '["GET /arvados/v1/virtual_machines",\n
14 "GET /arvados/v1/keep_services",\n
15 "GET /arvados/v1/keep_services/",\n
16 "GET /arvados/v1/groups",\n
17 "GET /arvados/v1/groups/",\n
18 "GET /arvados/v1/links",\n
19 "GET /arvados/v1/collections",\n
20 "POST /arvados/v1/collections",\n
21 "POST /arvados/v1/links",\n
22 "GET /arvados/v1/users/current",\n
23 "POST /arvados/v1/users/current",\n
24 "GET /arvados/v1/jobs",\n
25 "POST /arvados/v1/jobs",\n
26 "GET /arvados/v1/pipeline_instances",\n
27 "POST /arvados/v1/pipeline_instances",\n
28 "PUT /arvados/v1/pipeline_instances/",\n
29 "GET /arvados/v1/collections/",\n
30 "POST /arvados/v1/collections/",\n
31 "GET /arvados/v1/logs"]'
32 EOF
33
34 function usage {
35     echo >&2
36     echo >&2 "usage: $0 [options] <identifier>"
37     echo >&2
38     echo >&2 "   <identifier>                 Arvados cluster name"
39     echo >&2
40     echo >&2 "$0 options:"
41     echo >&2 "  -p, --port <ssh port>         SSH port to use (default 22)"
42     echo >&2 "  -c, --concurrency <max>       Maximum concurrency for puppet runs (default 5)"
43     echo >&2 "  -d, --debug                   Enable debug output"
44     echo >&2 "  -h, --help                    Display this help and exit"
45     echo >&2
46     echo >&2 "Note: this script requires an arvados token created with these permissions:"
47     echo >&2 '  arv api_client_authorization create_system_auth \'
48     echo -e $SCOPES"]'" >&2
49     echo >&2
50 }
51
52
53 # NOTE: This requires GNU getopt (part of the util-linux package on Debian-based distros).
54 TEMP=`getopt -o hdp:c: \
55     --long help,debug,port:,concurrency: \
56     -n "$0" -- "$@"`
57
58 if [ $? != 0 ] ; then echo "Use -h for help"; exit 1 ; fi
59 # Note the quotes around `$TEMP': they are essential!
60 eval set -- "$TEMP"
61
62 while [ $# -ge 1 ]
63 do
64     case $1 in
65         -p | --port)
66             SSH_PORT="$2"; shift 2
67             ;;
68         -c | --concurrency)
69             PUPPET_CONCURRENCY="$2"; shift 2
70             ;;
71         -d | --debug)
72             DEBUG=1
73             shift
74             ;;
75         --)
76             shift
77             break
78             ;;
79         *)
80             usage
81             exit 1
82             ;;
83     esac
84 done
85
86 IDENTIFIER=$1
87
88 if [[ "$IDENTIFIER" == '' ]]; then
89   usage
90   exit 1
91 fi
92
93 EXITCODE=0
94
95 COLUMNS=80
96
97 PUPPET_AGENT='
98 now() { date +%s; }
99 let endtime="$(now) + 600"
100 while [ "$endtime" -gt "$(now)" ]; do
101     puppet agent --test --detailed-exitcodes
102     agent_exitcode=$?
103     if [ 0 = "$agent_exitcode" ] || [ 2 = "$agent_exitcode" ]; then
104         break
105     else
106         sleep 10s
107     fi
108 done
109 exit ${agent_exitcode:-99}
110 '
111
112 title () {
113   date=`date +'%Y-%m-%d %H:%M:%S'`
114   printf "$date $1\n"
115 }
116
117 function run_puppet() {
118   node=$1
119
120   title "Running puppet on $node"
121   sleep $[ $RANDOM / 6000 ].$[ $RANDOM / 1000 ]
122   TMP_FILE=`mktemp`
123   if [[ "$DEBUG" != "0" ]]; then
124     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C bash -c "'$PUPPET_AGENT'" | tee $TMP_FILE
125   else
126     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C bash -c "'$PUPPET_AGENT'" > $TMP_FILE 2>&1
127   fi
128
129   ECODE=${PIPESTATUS[0]}
130   RESULT=$(cat $TMP_FILE)
131
132   if [[ "$ECODE" != "255" && ! ("$RESULT" =~ 'already in progress') && "$ECODE" != "2" && "$ECODE" != "0"  ]]; then
133     # Ssh exits 255 if the connection timed out. Just ignore that.
134     # Puppet exits 2 if there are changes. For real!
135     # Puppet prints 'Notice: Run of Puppet configuration client already in progress' if another puppet process
136     #   was already running
137     echo "ERROR running puppet on $node: exit code $ECODE"
138     if [[ "$DEBUG" == "0" ]]; then
139       title "Command output follows:"
140       echo $RESULT
141     fi
142   fi
143   if [[ "$ECODE" == "255" ]]; then
144     title "Connection timed out"
145     ECODE=0
146   fi
147   if [[ "$ECODE" == "2" ]]; then
148     ECODE=0
149   fi
150
151   if [[ "$ECODE" == "0" ]]; then
152       rm -f $TMP_FILE
153       echo $node successfully updates
154   else
155       echo $node exit code: $ECODE see $TMP_FILE for details
156   fi
157 }
158
159 function run_command() {
160   node=$1
161   return_var=$2
162   command=$3
163
164   title "Running '$command' on $node"
165   TMP_FILE=`mktemp`
166   if [[ "$DEBUG" != "0" ]]; then
167     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 125" root@$node -C "$command" | tee $TMP_FILE
168   else
169     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 125" root@$node -C "$command" > $TMP_FILE 2>&1
170   fi
171
172   ECODE=$?
173   RESULT=$(cat $TMP_FILE)
174
175   if [[ "$ECODE" != "255" && "$ECODE" != "0"  ]]; then
176     # Ssh exists 255 if the connection timed out. Just ignore that, it's possible that this node is
177     #   a shell node that is down.
178     title "ERROR running command on $node: exit code $ECODE"
179     if [[ "$DEBUG" == "0" ]]; then
180       title "Command output follows:"
181       echo $RESULT
182     fi
183   fi
184   if [[ "$ECODE" == "255" ]]; then
185     title "Connection timed out"
186     ECODE=0
187   fi
188   rm -f $TMP_FILE
189   eval "$return_var=$ECODE"
190 }
191
192 title "Updating API server"
193 SUM_ECODE=0
194 run_puppet $IDENTIFIER.arvadosapi.com ECODE
195 SUM_ECODE=$(($SUM_ECODE + $ECODE))
196
197 if [[ "$SUM_ECODE" != "0" ]]; then
198   title "ERROR: Updating API server FAILED"
199   EXITCODE=$(($EXITCODE + $SUM_ECODE))
200   exit $EXITCODE
201 fi
202
203 title "Loading ARVADOS_API_HOST and ARVADOS_API_TOKEN"
204 if [[ -f "$HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf" ]]; then
205   . $HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf
206 else
207   title "WARNING: $HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf not found."
208 fi
209 if [[ "$ARVADOS_API_HOST" == "" ]] || [[ "$ARVADOS_API_TOKEN" == "" ]]; then
210   title "ERROR: ARVADOS_API_HOST and/or ARVADOS_API_TOKEN environment variables are not set."
211   exit 1
212 fi
213
214 title "Gathering list of shell and Keep nodes"
215 SHELL_NODES=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN rvm-exec default arv virtual_machine list |jq .items[].hostname -r`
216 KEEP_NODES=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN rvm-exec default arv keep_service list |jq .items[].service_host -r`
217
218 nodes=""
219 for n in workbench manage switchyard $SHELL_NODES $KEEP_NODES; do
220   ECODE=0
221   if [[ $n =~ $ARVADOS_API_HOST$ ]]; then
222     # e.g. keep.qr1hi.arvadosapi.com
223     node=$n
224   else
225     # e.g. shell
226     node=$n.$ARVADOS_API_HOST
227   fi
228   # e.g. keep.qr1hi
229   nodes="$nodes ${node%.arvadosapi.com}"
230 done
231
232 ## at this point nodes should be an array containing
233 ## manage.qr1hi,  keep.qr1hi, etc
234 ## that should be defined in the .ssh/config file
235 title "Updating in parallel: $nodes"
236 export -f run_puppet
237 export -f title
238 export SSH_PORT
239 export PUPPET_AGENT
240 echo $nodes|xargs -d " " -n 1 -P $PUPPET_CONCURRENCY -I {} bash -c "run_puppet {}"
241
242 title "Locating Arvados Standard Docker images project"
243
244 JSON_FILTER="[[\"name\", \"=\", \"Arvados Standard Docker Images\"], [\"owner_uuid\", \"=\", \"$IDENTIFIER-tpzed-000000000000000\"]]"
245 DOCKER_IMAGES_PROJECT=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv --format=uuid group list --filters="$JSON_FILTER"`
246
247 if [[ "$DOCKER_IMAGES_PROJECT" == "" ]]; then
248   title "Warning: Arvados Standard Docker Images project not found. Creating it."
249
250   DOCKER_IMAGES_PROJECT=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv --format=uuid group create --group "{\"owner_uuid\":\"$IDENTIFIER-tpzed-000000000000000\", \"name\":\"Arvados Standard Docker Images\", \"group_class\":\"project\"}"`
251   ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv link create --link "{\"tail_uuid\":\"$IDENTIFIER-j7d0g-fffffffffffffff\", \"head_uuid\":\"$DOCKER_IMAGES_PROJECT\", \"link_class\":\"permission\", \"name\":\"can_read\" }"
252   if [[ "$?" != "0" ]]; then
253     title "ERROR: could not create standard Docker images project Please create it, cf. http://doc.arvados.org/install/create-standard-objects.html"
254     exit 1
255   fi
256 fi
257
258 title "Found Arvados Standard Docker Images project with uuid $DOCKER_IMAGES_PROJECT"
259 GIT_COMMIT=`ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER "python -c 'import arvados_cwl ; print arvados_cwl.__version__'" 2>&1 |grep -v INFO:rdflib:RDFLib`
260
261 if [[ "$?" != "0" ]] || [[ "$GIT_COMMIT" == "" ]]; then
262   title "ERROR: unable to get arvados/jobs Docker image git revision"
263   exit 1
264 else
265   title "Found git commit for arvados/jobs Docker image: $GIT_COMMIT"
266 fi
267
268 run_command shell.$IDENTIFIER ECODE "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN /usr/local/rvm/bin/rvm-exec default arv keep docker" |grep -q $GIT_COMMIT
269
270 if [[ "$?" == "0" ]]; then
271   title "Found latest arvados/jobs Docker image, nothing to upload"
272   # Just in case it isn't yet, tag the image as latest
273   ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv-keepdocker arvados/jobs latest"
274 else
275   title "Installing latest arvados/jobs Docker image"
276   ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN /usr/local/rvm/bin/rvm-exec default arv keep docker --pull --project-uuid=$DOCKER_IMAGES_PROJECT arvados/jobs $GIT_COMMIT"
277   ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER docker tag --force >/dev/null 2>&1
278   # docker 1.13 no longer supports --force. Sigh.
279   if [[ "$?" == "125" ]]; then
280     FORCE_TAG=""
281   else
282     FORCE_TAG="--force"
283   fi
284   ## adding latest tag too  refs 9254
285   ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER docker tag $FORCE_TAG arvados/jobs:$GIT_COMMIT arvados/jobs:latest
286   ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv-keepdocker --project-uuid=$DOCKER_IMAGES_PROJECT arvados/jobs latest"
287   if [[ "$?" -ne 0 ]]; then
288     title "'git pull' failed exiting..."
289     exit 1
290   fi
291 fi