Default run-deploy.sh to ssh port 22, and provide a command line option
[arvados-dev.git] / jenkins / run-deploy.sh
1 #!/bin/bash
2
3 DEBUG=0
4 SSH_PORT=22
5
6 function usage {
7     echo >&2
8     echo >&2 "usage: $0 [options] <identifier>"
9     echo >&2
10     echo >&2 "   <identifier>                 Arvados cluster name"
11     echo >&2
12     echo >&2 "$0 options:"
13     echo >&2 "  -p, --port <ssh port>         SSH port to use (default 22)"
14     echo >&2 "  -d, --debug                   Enable debug output"
15     echo >&2 "  -h, --help                    Display this help and exit"
16     echo >&2
17     echo >&2 "Note: this script requires an arvados token created with these permissions:"
18     echo >&2 '  arv api_client_authorization create_system_auth \'
19     echo >&2 '    --scopes "[\"GET /arvados/v1/virtual_machines\",'
20     echo >&2 '               \"GET /arvados/v1/keep_services\",'
21     echo >&2 '               \"GET /arvados/v1/keep_services/\",'
22     echo >&2 '               \"GET /arvados/v1/groups\",'
23     echo >&2 '               \"GET /arvados/v1/groups/\",'
24     echo >&2 '               \"GET /arvados/v1/links\",'
25     echo >&2 '               \"GET /arvados/v1/collections\",'
26     echo >&2 '               \"POST /arvados/v1/collections\",'
27     echo >&2 '               \"POST /arvados/v1/links\"]"'
28     echo >&2
29 }
30
31 # NOTE: This requires GNU getopt (part of the util-linux package on Debian-based distros).
32 TEMP=`getopt -o hdp: \
33     --long help,debug,port: \
34     -n "$0" -- "$@"`
35
36 if [ $? != 0 ] ; then echo "Use -h for help"; exit 1 ; fi
37 # Note the quotes around `$TEMP': they are essential!
38 eval set -- "$TEMP"
39
40 while [ $# -ge 1 ]
41 do
42     case $1 in
43         -p | --port)
44             SSH_PORT="$2"; shift 2
45             ;;
46         -d | --debug)
47             DEBUG=1
48             shift
49             ;;
50         --)
51             shift
52             break
53             ;;
54         *)
55             usage
56             exit 1
57             ;;
58     esac
59 done
60
61 IDENTIFIER=$1
62
63 if [[ "$IDENTIFIER" == '' ]]; then
64   usage
65   exit 1
66 fi
67
68 EXITCODE=0
69
70 COLUMNS=80
71
72 PUPPET_AGENT='
73 now() { date +%s; }
74 let endtime="$(now) + 600"
75 while [ "$endtime" -gt "$(now)" ]; do
76     puppet agent --test --detailed-exitcodes
77     agent_exitcode=$?
78     if [ 0 = "$agent_exitcode" ] || [ 2 = "$agent_exitcode" ]; then
79         break
80     else
81         sleep 10s
82     fi
83 done
84 exit ${agent_exitcode:-99}
85 '
86
87 title () {
88   date=`date +'%Y-%m-%d %H:%M:%S'`
89   printf "$date $1\n"
90 }
91
92 function run_puppet() {
93   node=$1
94   return_var=$2
95
96   title "Running puppet on $node"
97   TMP_FILE=`mktemp`
98   if [[ "$DEBUG" != "0" ]]; then
99     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C bash -c "'$PUPPET_AGENT'" | tee $TMP_FILE
100   else
101     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C bash -c "'$PUPPET_AGENT'" > $TMP_FILE 2>&1
102   fi
103
104   ECODE=${PIPESTATUS[0]}
105   RESULT=$(cat $TMP_FILE)
106
107   if [[ "$ECODE" != "255" && ! ("$RESULT" =~ 'already in progress') && "$ECODE" != "2" && "$ECODE" != "0"  ]]; then
108     # Ssh exits 255 if the connection timed out. Just ignore that.
109     # Puppet exits 2 if there are changes. For real!
110     # Puppet prints 'Notice: Run of Puppet configuration client already in progress' if another puppet process
111     #   was already running
112     echo "ERROR running puppet on $node: exit code $ECODE"
113     if [[ "$DEBUG" == "0" ]]; then
114       title "Command output follows:"
115       echo $RESULT
116     fi
117   fi
118   if [[ "$ECODE" == "255" ]]; then
119     title "Connection timed out"
120     ECODE=0
121   fi
122   if [[ "$ECODE" == "2" ]]; then
123     ECODE=0
124   fi
125   rm -f $TMP_FILE
126   eval "$return_var=$ECODE"
127 }
128
129 function run_command() {
130   node=$1
131   return_var=$2
132   command=$3
133
134   title "Running '$command' on $node"
135   TMP_FILE=`mktemp`
136   if [[ "$DEBUG" != "0" ]]; then
137     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C "$command" | tee $TMP_FILE
138   else
139     ssh -t -p$SSH_PORT -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C "$command" > $TMP_FILE 2>&1
140   fi
141
142   ECODE=$?
143   RESULT=$(cat $TMP_FILE)
144
145   if [[ "$ECODE" != "255" && "$ECODE" != "0"  ]]; then
146     # Ssh exists 255 if the connection timed out. Just ignore that, it's possible that this node is
147     #   a shell node that is down.
148     title "ERROR running command on $node: exit code $ECODE"
149     if [[ "$DEBUG" == "0" ]]; then
150       title "Command output follows:"
151       echo $RESULT
152     fi
153   fi
154   if [[ "$ECODE" == "255" ]]; then
155     title "Connection timed out"
156     ECODE=0
157   fi
158   rm -f $TMP_FILE
159   eval "$return_var=$ECODE"
160 }
161
162 title "Updating API server"
163 SUM_ECODE=0
164 run_puppet $IDENTIFIER.arvadosapi.com ECODE
165 SUM_ECODE=$(($SUM_ECODE + $ECODE))
166 run_command $IDENTIFIER.arvadosapi.com ECODE "/usr/local/rvm/bin/rvm-exec /usr/local/bin/arvados-api-server-upgrade.sh"
167 SUM_ECODE=$(($SUM_ECODE + $ECODE))
168 if [ ! "$IDENTIFIER" = "c97qk" ]
169 then
170   run_command $IDENTIFIER.arvadosapi.com ECODE "dpkg -L arvados-mailchimp-plugin 2>/dev/null && apt-get install arvados-mailchimp-plugin --reinstall || echo"
171   SUM_ECODE=$(($SUM_ECODE + $ECODE))
172 fi
173
174 if [[ "$SUM_ECODE" != "0" ]]; then
175   title "ERROR: Updating API server FAILED"
176   EXITCODE=$(($EXITCODE + $SUM_ECODE))
177   exit $EXITCODE
178 fi
179
180 title "Loading ARVADOS_API_HOST and ARVADOS_API_TOKEN"
181 if [[ -f "$HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf" ]]; then
182   . $HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf
183 else
184   title "WARNING: $HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf not found."
185 fi
186 if [[ "$ARVADOS_API_HOST" == "" ]] || [[ "$ARVADOS_API_TOKEN" == "" ]]; then
187   title "ERROR: ARVADOS_API_HOST and/or ARVADOS_API_TOKEN environment variables are not set."
188   exit 1
189 fi
190
191 title "Locating Arvados Standard Docker images project"
192
193 JSON_FILTER="[[\"name\", \"=\", \"Arvados Standard Docker Images\"], [\"owner_uuid\", \"=\", \"$IDENTIFIER-tpzed-000000000000000\"]]"
194 DOCKER_IMAGES_PROJECT=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv --format=uuid group list --filters="$JSON_FILTER"`
195
196 if [[ "$DOCKER_IMAGES_PROJECT" == "" ]]; then
197   title "Warning: Arvados Standard Docker Images project not found. Creating it."
198
199   DOCKER_IMAGES_PROJECT=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv --format=uuid group create --group "{\"owner_uuid\":\"$IDENTIFIER-tpzed-000000000000000\", \"name\":\"Arvados Standard Docker Images\", \"group_class\":\"project\"}"`
200   ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv link create --link "{\"tail_uuid\":\"$IDENTIFIER-j7d0g-fffffffffffffff\", \"head_uuid\":\"$DOCKER_IMAGES_PROJECT\", \"link_class\":\"permission\", \"name\":\"can_read\" }"
201   if [[ "$?" != "0" ]]; then
202     title "ERROR: could not create standard Docker images project Please create it, cf. http://doc.arvados.org/install/create-standard-objects.html"
203     exit 1
204   fi
205 fi
206
207 title "Found Arvados Standard Docker Images project with uuid $DOCKER_IMAGES_PROJECT"
208 GIT_COMMIT=`ssh -o "StrictHostKeyChecking no" $IDENTIFIER cat /usr/local/arvados/src/git-commit.version`
209
210 if [[ "$?" != "0" ]] || [[ "$GIT_COMMIT" == "" ]]; then
211   title "ERROR: unable to get arvados/jobs Docker image git revision"
212   exit 1
213 else
214   title "Found git commit for arvados/jobs Docker image: $GIT_COMMIT"
215 fi
216
217 run_command shell.$IDENTIFIER ECODE "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN /usr/local/rvm/bin/rvm-exec default arv keep docker" |grep -q $GIT_COMMIT
218
219 if [[ "$?" == "0" ]]; then
220   title "Found latest arvados/jobs Docker image, nothing to upload"
221 else
222   title "Installing latest arvados/jobs Docker image"
223   ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN /usr/local/rvm/bin/rvm-exec default arv keep docker --pull --project-uuid=$DOCKER_IMAGES_PROJECT arvados/jobs $GIT_COMMIT"
224   if [[ "$?" -ne 0 ]]; then
225     title "'git pull' failed exiting..."
226     exit 1
227   fi
228 fi
229
230 title "Gathering list of shell and Keep nodes"
231 SHELL_NODES=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv virtual_machine list |jq .items[].hostname -r`
232 KEEP_NODES=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv keep_service list |jq .items[].service_host -r`
233
234 title "Updating workbench"
235 SUM_ECODE=0
236 if [[ `host workbench.$ARVADOS_API_HOST |cut -f4 -d' '` != `host $ARVADOS_API_HOST |cut -f4 -d' '` ]]; then
237   # Workbench runs on a separate host. We need to run puppet there too.
238   run_puppet workbench.$IDENTIFIER ECODE
239   SUM_ECODE=$(($SUM_ECODE + $ECODE))
240 fi
241
242 run_command workbench.$IDENTIFIER ECODE "/usr/local/rvm/bin/rvm-exec /usr/local/bin/arvados-workbench-upgrade.sh"
243 SUM_ECODE=$(($SUM_ECODE + $ECODE))
244
245 if [[ "$SUM_ECODE" != "0" ]]; then
246   title "ERROR: Updating workbench FAILED"
247   EXITCODE=$(($EXITCODE + $SUM_ECODE))
248   exit $EXITCODE
249 fi
250
251 for n in manage switchyard $SHELL_NODES $KEEP_NODES; do
252   ECODE=0
253   if [[ $n =~ $ARVADOS_API_HOST$ ]]; then
254     # e.g. keep.qr1hi.arvadosapi.com
255     node=$n
256   else
257     # e.g. shell
258     node=$n.$ARVADOS_API_HOST
259   fi
260
261   # e.g. keep.qr1hi
262   node=${node%.arvadosapi.com}
263
264   title "Updating $node"
265   run_puppet $node ECODE
266   if [[ "$ECODE" != "0" ]]; then
267     title "ERROR: Updating $node node FAILED: exit code $ECODE"
268     EXITCODE=$(($EXITCODE + $ECODE))
269     exit $EXITCODE
270   fi
271 done