run_deploy.sh improvements:
[arvados-dev.git] / jenkins / run-deploy.sh
1 #!/bin/bash
2
3 DEBUG=0
4
5 function usage {
6     echo >&2
7     echo >&2 "usage: $0 [options] <identifier>"
8     echo >&2
9     echo >&2 "   <identifier>                 Arvados cluster name"
10     echo >&2
11     echo >&2 "$0 options:"
12     echo >&2 "  -d, --debug                   Enable debug output"
13     echo >&2 "  -h, --help                    Display this help and exit"
14     echo >&2
15     echo >&2 "Note: this script requires an arvados token created with these permissions:"
16     echo >&2 '  arv api_client_authorization create_system_auth \'
17     echo >&2 '    --scopes "[\"GET /arvados/v1/virtual_machines\",'
18     echo >&2 '               \"GET /arvados/v1/keep_services\",'
19     echo >&2 '               \"GET /arvados/v1/groups\",'
20     echo >&2 '               \"GET /arvados/v1/links\",'
21     echo >&2 '               \"GET /arvados/v1/groups/\",'
22     echo >&2 '               \"GET /arvados/v1/keep_services/accessible\",'
23     echo >&2 '               \"POST /arvados/v1/collections\",'
24     echo >&2 '               \"POST /arvados/v1/links\"]"'
25     echo >&2
26 }
27
28 # NOTE: This requires GNU getopt (part of the util-linux package on Debian-based distros).
29 TEMP=`getopt -o hd \
30     --long help,debug \
31     -n "$0" -- "$@"`
32
33 if [ $? != 0 ] ; then echo "Use -h for help"; exit 1 ; fi
34 # Note the quotes around `$TEMP': they are essential!
35 eval set -- "$TEMP"
36
37 while [ $# -ge 1 ]
38 do
39     case $1 in
40         -d | --debug)
41             DEBUG=1
42             shift
43             ;;
44         --)
45             shift
46             break
47             ;;
48         *)
49             usage
50             exit 1
51             ;;
52     esac
53 done
54
55 IDENTIFIER=$1
56
57 if [[ "$IDENTIFIER" == '' ]]; then
58   usage
59   exit 1
60 fi
61
62 EXITCODE=0
63
64 COLUMNS=80
65
66 title () {
67   date=`date +'%Y-%m-%d %H:%M:%S'`
68   printf "$date $1\n"
69 }
70
71 function run_puppet() {
72   node=$1
73   return_var=$2
74
75   title "Running puppet on $node"
76   TMP_FILE=`mktemp`
77   if [[ "$DEBUG" != "0" ]]; then
78     ssh -t -p2222 -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C "/usr/bin/puppet agent -t" | tee $TMP_FILE
79   else
80     ssh -t -p2222 -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C "/usr/bin/puppet agent -t" > $TMP_FILE 2>&1
81   fi
82
83   ECODE=$?
84   RESULT=$(cat $TMP_FILE)
85
86   if [[ "$ECODE" != "255" && ! ("$RESULT" =~ 'already in progress') && "$ECODE" != "2" && "$ECODE" != "0"  ]]; then
87     # Ssh exits 255 if the connection timed out. Just ignore that.
88     # Puppet exits 2 if there are changes. For real!
89     # Puppet prints 'Notice: Run of Puppet configuration client already in progress' if another puppet process
90     #   was already running
91     echo "ERROR running puppet on $node: exit code $ECODE"
92     if [[ "$DEBUG" == "0" ]]; then
93       title "Command output follows:"
94       echo $RESULT
95     fi
96   fi
97   if [[ "$ECODE" == "255" ]]; then
98     title "Connection timed out"
99     ECODE=0
100   fi
101   if [[ "$ECODE" == "2" ]]; then
102     ECODE=0
103   fi
104   rm -f $TMP_FILE
105   eval "$return_var=$ECODE"
106 }
107
108 function run_command() {
109   node=$1
110   return_var=$2
111   command=$3
112
113   title "Running '$command' on $node"
114   TMP_FILE=`mktemp`
115   if [[ "$DEBUG" != "0" ]]; then
116     ssh -t -p2222 -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C "$command" | tee $TMP_FILE
117   else
118     ssh -t -p2222 -o "StrictHostKeyChecking no" -o "ConnectTimeout 5" root@$node -C "$command" > $TMP_FILE 2>&1
119   fi
120
121   ECODE=$?
122   RESULT=$(cat $TMP_FILE)
123
124   if [[ "$ECODE" != "255" && "$ECODE" != "0"  ]]; then
125     # Ssh exists 255 if the connection timed out. Just ignore that, it's possible that this node is
126     #   a shell node that is down.
127     title "ERROR running command on $node: exit code $ECODE"
128     if [[ "$DEBUG" == "0" ]]; then
129       title "Command output follows:"
130       echo $RESULT
131     fi
132   fi
133   if [[ "$ECODE" == "255" ]]; then
134     title "Connection timed out"
135     ECODE=0
136   fi
137   rm -f $TMP_FILE
138   eval "$return_var=$ECODE"
139 }
140
141 title "Loading ARVADOS_API_HOST and ARVADOS_API_TOKEN"
142 if [[ -f "$HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf" ]]; then
143   . $HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf
144 else
145   title "WARNING: $HOME/.config/arvados/$IDENTIFIER.arvadosapi.com.conf not found."
146 fi
147 if [[ "$ARVADOS_API_HOST" == "" ]] || [[ "$ARVADOS_API_TOKEN" == "" ]]; then
148   title "ERROR: ARVADOS_API_HOST and/or ARVADOS_API_TOKEN environment variables are not set."
149   exit 1
150 fi
151
152 title "Locating Arvados Standard Docker images project"
153
154 JSON_FILTER="[[\"name\", \"=\", \"Arvados Standard Docker Images\"], [\"owner_uuid\", \"=\", \"$IDENTIFIER-tpzed-000000000000000\"]]"
155 DOCKER_IMAGES_PROJECT=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv --format=uuid group list --filters="$JSON_FILTER"`
156
157 if [[ "$DOCKER_IMAGES_PROJECT" == "" ]]; then
158   title "Warning: Arvados Standard Docker Images project not found. Creating it."
159
160   DOCKER_IMAGES_PROJECT=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv --format=uuid group create --group "{\"owner_uuid\":\"$IDENTIFIER-tpzed-000000000000000\", \"name\":\"Arvados Standard Docker Images\", \"group_class\":\"project\"}"`
161   ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv link create --link "{\"tail_uuid\":\"$IDENTIFIER-j7d0g-fffffffffffffff\", \"head_uuid\":\"$DOCKER_IMAGES_PROJECT\", \"link_class\":\"permission\", \"name\":\"can_read\" }"
162   if [[ "$?" != "0" ]]; then
163     title "ERROR: could not create standard Docker images project Please create it, cf. http://doc.arvados.org/install/create-standard-objects.html"
164     exit 1
165   fi
166 fi
167
168 title "Found Arvados Standard Docker Images project with uuid $DOCKER_IMAGES_PROJECT"
169 GIT_COMMIT=`ssh -o "StrictHostKeyChecking no" $IDENTIFIER cat /usr/local/arvados/src/git-commit.version`
170
171 if [[ "$?" != "0" ]] || [[ "$GIT_COMMIT" == "" ]]; then
172   title "ERROR: unable to get arvados/jobs Docker image git revision"
173   exit 1
174 else
175   title "Found git commit for arvados/jobs Docker image: $GIT_COMMIT"
176 fi
177
178 run_command shell.$IDENTIFIER ECODE "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN /usr/local/rvm/bin/rvm-exec default arv keep docker" |grep -q $GIT_COMMIT
179
180 if [[ "$?" == "0" ]]; then
181   title "Found latest arvados/jobs Docker image, nothing to upload"
182 else
183   title "Installing latest arvados/jobs Docker image"
184   ssh -o "StrictHostKeyChecking no" shell.$IDENTIFIER "ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN /usr/local/rvm/bin/rvm-exec default arv keep docker --pull --project-uuid=$DOCKER_IMAGES_PROJECT arvados/jobs $GIT_COMMIT"
185 fi
186
187 title "Gathering list of shell and Keep nodes"
188 SHELL_NODES=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv virtual_machine list |jq .items[].hostname -r`
189 KEEP_NODES=`ARVADOS_API_HOST=$ARVADOS_API_HOST ARVADOS_API_TOKEN=$ARVADOS_API_TOKEN arv keep_service list |jq .items[].service_host -r`
190
191 title "Updating API server"
192 SUM_ECODE=0
193 run_puppet $IDENTIFIER ECODE
194 SUM_ECODE=$(($SUM_ECODE + $ECODE))
195 run_command $IDENTIFIER ECODE "/usr/local/bin/arvados-api-server-upgrade.sh"
196 SUM_ECODE=$(($SUM_ECODE + $ECODE))
197 run_command $IDENTIFIER ECODE "dpkg -L arvados-mailchimp-plugin 2>/dev/null && apt-get install arvados-mailchimp-plugin --reinstall || echo"
198 SUM_ECODE=$(($SUM_ECODE + $ECODE))
199
200 if [[ "$SUM_ECODE" != "0" ]]; then
201   title "ERROR: Updating API server FAILED"
202   EXITCODE=$(($EXITCODE + $SUM_ECODE))
203   exit $EXITCODE
204 fi
205
206 title "Updating workbench"
207 SUM_ECODE=0
208 if [[ `host workbench.$ARVADOS_API_HOST` != `host $ARVADOS_API_HOST` ]]; then
209   # Workbench runs on a separate host. We need to run puppet there too.
210   run_puppet workbench.$IDENTIFIER ECODE
211   SUM_ECODE=$(($SUM_ECODE + $ECODE))
212 fi
213
214 run_command workbench.$IDENTIFIER ECODE "/usr/local/bin/arvados-workbench-upgrade.sh"
215 SUM_ECODE=$(($SUM_ECODE + $ECODE))
216
217 if [[ "$SUM_ECODE" != "0" ]]; then
218   title "ERROR: Updating workbench FAILED"
219   EXITCODE=$(($EXITCODE + $SUM_ECODE))
220   exit $EXITCODE
221 fi
222
223 for n in manage $SHELL_NODES $KEEP_NODES; do
224   ECODE=0
225   if [[ $n =~ $ARVADOS_API_HOST$ ]]; then
226     # e.g. keep.qr1hi.arvadosapi.com
227     node=$n
228   else
229     # e.g. shell
230     node=$n.$ARVADOS_API_HOST
231   fi
232
233   # e.g. keep.qr1hi
234   node=${node%.arvadosapi.com}
235
236   title "Updating $node"
237   run_puppet $node ECODE
238   if [[ "$ECODE" != "0" ]]; then
239     title "ERROR: Updating $node node FAILED: exit code $ECODE"
240     EXITCODE=$(($EXITCODE + $ECODE))
241     exit $EXITCODE
242   fi
243 done