3147: Add retry support to Python CLI tools.
[arvados.git] / docker / arvdock
1 #!/bin/bash
2
3 ENABLE_SSH=false
4 DOCKER=`which docker.io`
5
6 if [[ "$DOCKER" == "" ]]; then
7     DOCKER=`which docker`
8 fi
9
10 COMPUTE_COUNTER=0
11
12 function usage {
13     echo >&2
14     echo >&2 "usage: $0 (start|stop|restart|test) [options]"
15     echo >&2
16     echo >&2 "$0 start/stop/restart options:"
17     echo >&2 "  -d[port], --doc[=port]        Documentation server (default port 9898)"
18     echo >&2 "  -w[port], --workbench[=port]  Workbench server (default port 9899)"
19     echo >&2 "  -s[port], --sso[=port]        SSO server (default port 9901)"
20     echo >&2 "  -a[port], --api[=port]        API server (default port 9900)"
21     echo >&2 "  -c, --compute                 Compute nodes (starts 2)"
22     echo >&2 "  -v, --vm                      Shell server"
23     echo >&2 "  -n, --nameserver              Nameserver"
24     echo >&2 "  -k, --keep                    Keep servers"
25     echo >&2 "  --ssh                         Enable SSH access to server containers"
26     echo >&2 "  -h, --help                    Display this help and exit"
27     echo >&2
28     echo >&2 "  If no options are given, the action is applied to all servers."
29     echo >&2
30     echo >&2 "$0 test [testname] [testname] ..."
31     echo >&2 "  By default, all tests are run."
32 }
33
34 function ip_address {
35     local container=$1
36     echo `$DOCKER inspect $container  |grep IPAddress |cut -f4 -d\"`
37 }
38
39 function start_container {
40     local args="-d -i -t"
41     if [[ "$1" != '' ]]; then
42       local port="$1"
43       args="$args -p $port"
44     fi
45     if [[ "$2" != '' ]]; then
46       local name="$2"
47       if [[ "$name" == "api_server" ]]; then
48         args="$args --dns=172.17.42.1 --dns-search=compute.dev.arvados --hostname api -P --name $name"
49       elif [[ "$name" == "compute" ]]; then
50         name=$name$COMPUTE_COUNTER
51         # We need --privileged because we run docker-inside-docker on the compute nodes
52         args="$args --dns=172.17.42.1 --dns-search=compute.dev.arvados --hostname compute$COMPUTE_COUNTER -P --privileged --name $name"
53         let COMPUTE_COUNTER=$(($COMPUTE_COUNTER + 1))
54       else
55         args="$args --dns=172.17.42.1 --dns-search=dev.arvados --hostname ${name#_server} --name $name"
56       fi
57     fi
58     if [[ "$3" != '' ]]; then
59       local volume="$3"
60       args="$args -v $volume"
61     fi
62     if [[ "$4" != '' ]]; then
63       local link="$4"
64       args="$args --link $link"
65     fi
66     local image=$5
67
68     if $ENABLE_SSH
69     then
70       args="$args -e ENABLE_SSH=$ENABLE_SSH"
71     fi
72
73     `$DOCKER ps |grep -P "$name[^/]" -q`
74     if [[ "$?" == "0" ]]; then
75       echo "You have a running container with name $name -- skipping."
76       return
77     fi
78
79     # Remove any existing container by this name.
80     $DOCKER rm "$name" 2>/dev/null
81
82     echo "Starting container:"
83     #echo "  $DOCKER run --dns=127.0.0.1 $args $image"
84     echo "  $DOCKER run $args $image"
85     container=`$DOCKER run $args $image`
86     if [ "$?" != "0" -o "$container" = "" ]; then
87       echo "Unable to start container"
88       exit 1
89     fi
90     if [ "$name" == "compute" -o "$ENABLE_SSH" != "false" ];
91     then
92       ip=$(ip_address $container )
93       echo
94       echo "You can ssh into the container with:"
95       echo
96       echo "    ssh root@$ip"
97       echo
98     else
99       echo "Started container: $container"
100     fi
101
102     if [[ "$name" == "doc_server" ]]; then
103       echo
104       echo "*****************************************************************"
105       echo "You can access the Arvados documentation at http://localhost:${port%:*}"
106       echo "*****************************************************************"
107       echo
108     fi
109
110     if [[ "$name" == "workbench_server" ]]; then
111       echo
112       echo "*****************************************************************"
113       echo "You can access the Arvados workbench at http://localhost:${port%:*}"
114       echo "*****************************************************************"
115       echo
116    fi
117
118
119 }
120
121 declare -a keep_volumes
122
123 # Initialize the global `keep_volumes' array. If any keep volumes
124 # already appear to exist (mounted volumes with a top-level "keep"
125 # directory), use them; create temporary volumes if necessary.
126 #
127 function make_keep_volumes () {
128     # Mount a keep volume if we don't already have one
129     for mountpoint in $(cut -d ' ' -f 2 /proc/mounts); do
130       if [[ -d "$mountpoint/keep" && "$mountpoint" != "/" ]]; then
131         keep_volumes+=($mountpoint)
132       fi
133     done
134
135     # Create any keep volumes that do not yet exist.
136     while [ ${#keep_volumes[*]} -lt 2 ]
137     do
138         new_keep=$(mktemp -d)
139         echo >&2 "mounting 512M tmpfs keep volume in $new_keep"
140         sudo mount -t tmpfs -o size=512M tmpfs $new_keep
141         mkdir $new_keep/keep
142         keep_volumes+=($new_keep)
143     done
144 }
145
146 function do_start {
147     local start_doc=false
148     local start_sso=false
149     local start_api=false
150     local start_compute=false
151     local start_workbench=false
152     local start_vm=false
153     local start_nameserver=false
154     local start_keep=false
155
156     # NOTE: This requires GNU getopt (part of the util-linux package on Debian-based distros).
157     local TEMP=`getopt -o d::s::a::cw::nkvh \
158                   --long doc::,sso::,api::,compute,workbench::,nameserver,keep,vm,help,ssh \
159                   -n "$0" -- "$@"`
160
161     if [ $? != 0 ] ; then echo "Use -h for help"; exit 1 ; fi
162
163     # Note the quotes around `$TEMP': they are essential!
164     eval set -- "$TEMP"
165
166     while [ $# -ge 1 ]
167     do
168         case $1 in
169             -d | --doc)
170                 case "$2" in
171                     "") start_doc=9898; shift 2 ;;
172                     *)  start_doc=$2; shift 2 ;;
173                 esac
174                 ;;
175             -s | --sso)
176                 case "$2" in
177                     "") start_sso=9901; shift 2 ;;
178                     *)  start_sso=$2; shift 2 ;;
179                 esac
180                 ;;
181             -a | --api)
182                 case "$2" in
183                     "") start_api=9900; shift 2 ;;
184                     *)  start_api=$2; shift 2 ;;
185                 esac
186                 ;;
187             -c | --compute)
188                 start_compute=2
189                 shift
190                 ;;
191             -w | --workbench)
192                 case "$2" in
193                     "") start_workbench=9899; shift 2 ;;
194                     *)  start_workbench=$2; shift 2 ;;
195                 esac
196                 ;;
197             -v | --vm)
198                 start_vm=true
199                 shift
200                 ;;
201             -n | --nameserver)
202                 start_nameserver=true
203                 shift
204                 ;;
205             -k | --keep)
206                 start_keep=true
207                 shift
208                 ;;
209             --ssh)
210                 # ENABLE_SSH is a global variable
211                 ENABLE_SSH=true
212                 shift
213                 ;;
214             --)
215                 shift
216                 break
217                 ;;
218             *)
219                 usage
220                 exit 1
221                 ;;
222         esac
223     done
224
225     # If no options were selected, then start all servers.
226     if [[ $start_doc == false &&
227           $start_sso == false &&
228           $start_api == false &&
229           $start_compute == false &&
230           $start_workbench == false &&
231           $start_vm == false &&
232           $start_nameserver == false &&
233           $start_keep == false ]]
234     then
235         start_doc=9898
236         start_sso=9901
237         start_api=9900
238         start_compute=2
239         start_workbench=9899
240         start_vm=true
241         start_nameserver=true
242         start_keep=true
243     fi
244
245     if [[ $start_sso != false ]]
246     then
247         start_container "$start_sso:443" "sso_server" '' '' "arvados/sso"
248     fi
249
250     if [[ $start_api != false ]]
251     then
252         start_container "$start_api:443" "api_server" '' "sso_server:sso" "arvados/api"
253     fi
254
255     if [[ $start_nameserver != false ]]
256     then
257       # We rely on skydock and skydns for dns discovery between the slurm controller and compute nodes,
258       # so make sure they are running
259       $DOCKER ps | grep skydns >/dev/null
260       if [[ "$?" != "0" ]]; then
261         echo "Starting crosbymichael/skydns container..."
262         $DOCKER rm "skydns" 2>/dev/null
263         $DOCKER run -d -p 172.17.42.1:53:53/udp --name skydns crosbymichael/skydns -nameserver 8.8.8.8:53 -domain arvados
264       fi
265       $DOCKER ps | grep skydock >/dev/null
266       if [[ "$?" != "0" ]]; then
267         echo "Starting crosbymichael/skydock container..."
268         $DOCKER rm "skydock" 2>/dev/null
269         $DOCKER run -d -v /var/run/docker.sock:/docker.sock --name skydock crosbymichael/skydock -ttl 30 -environment dev -s /docker.sock -domain arvados -name skydns
270       fi
271     fi
272
273     if [[ $start_compute != false ]]
274     then
275         for i in `seq 0 $(($start_compute - 1))`; do
276           start_container "" "compute" '' "api_server:api" "arvados/compute"
277         done
278     fi
279
280     if [[ $start_keep != false ]]
281     then
282         # create `keep_volumes' array with a list of keep mount points
283         # remove any stale metadata from those volumes before starting them
284         make_keep_volumes
285         for v in ${keep_volumes[*]}
286         do
287             [ -f $v/keep/.metadata.yml ] && sudo rm $v/keep/.metadata.yml
288         done
289         start_container "25107:25107" "keep_server_0" \
290             "${keep_volumes[0]}:/keep-data" \
291             "api_server:api" \
292             "arvados/keep"
293         start_container "25108:25107" "keep_server_1" \
294             "${keep_volumes[1]}:/keep-data" \
295             "api_server:api" \
296             "arvados/keep"
297     fi
298
299     if [[ $start_doc != false ]]
300     then
301         start_container "$start_doc:80" "doc_server" '' '' "arvados/doc"
302     fi
303
304     if [[ $start_vm != false ]]
305     then
306         start_container "" "shell" '' "api_server:api" "arvados/shell"
307     fi
308
309     if [[ $start_workbench != false ]]
310     then
311         start_container "$start_workbench:80" "workbench_server" '' "api_server:api" "arvados/workbench"
312     fi
313
314     if [ -d $HOME/.config/arvados ] || mkdir -p $HOME/.config/arvados
315     then
316         cat >$HOME/.config/arvados/settings.conf <<EOF
317 ARVADOS_API_HOST=$(ip_address "api_server")
318 ARVADOS_API_HOST_INSECURE=yes
319 ARVADOS_API_TOKEN=$(cat api/generated/superuser_token)
320 EOF
321     fi
322
323 }
324
325 function do_stop {
326     local stop_doc=""
327     local stop_sso=""
328     local stop_api=""
329     local stop_compute=""
330     local stop_workbench=""
331     local stop_nameserver=""
332     local stop_vm=""
333     local stop_keep=""
334
335     # NOTE: This requires GNU getopt (part of the util-linux package on Debian-based distros).
336     local TEMP=`getopt -o dsacwnkvh \
337                   --long doc,sso,api,compute,workbench,nameserver,keep,vm,help \
338                   -n "$0" -- "$@"`
339
340     if [ $? != 0 ] ; then echo "Use -h for help"; exit 1 ; fi
341
342     # Note the quotes around `$TEMP': they are essential!
343     eval set -- "$TEMP"
344
345     while [ $# -ge 1 ]
346     do
347         case $1 in
348             -d | --doc)
349                 stop_doc=doc_server ; shift ;;
350             -s | --sso)
351                 stop_sso=sso_server ; shift ;;
352             -a | --api)
353                 stop_api=api_server ; shift ;;
354             -c | --compute)
355                 stop_compute=`$DOCKER ps |grep -P "compute\d+" |grep -v api_server |cut -f1 -d ' '` ; shift ;;
356             -w | --workbench)
357                 stop_workbench=workbench_server ; shift ;;
358             -n | --nameserver )
359                 stop_nameserver="skydock skydns" ; shift ;;
360             -v | --vm )
361                 stop_vm="shell" ; shift ;;
362             -k | --keep )
363                 stop_keep="keep_server_0 keep_server_1" ; shift ;;
364             --)
365                 shift
366                 break
367                 ;;
368             *)
369                 usage
370                 exit 1
371                 ;;
372         esac
373     done
374
375     # If no options were selected, then stop all servers.
376     if [[ $stop_doc == "" &&
377           $stop_sso == "" &&
378           $stop_api == "" &&
379           $stop_compute == "" &&
380           $stop_workbench == "" &&
381           $stop_vm == "" &&
382           $stop_nameserver == "" &&
383           $stop_keep == "" ]]
384     then
385         stop_doc=doc_server
386         stop_sso=sso_server
387         stop_api=api_server
388         stop_compute=`$DOCKER ps |grep -P "compute\d+" |grep -v api_server |cut -f1 -d ' '`
389         stop_workbench=workbench_server
390         stop_vm=shell
391         stop_nameserver="skydock skydns"
392         stop_keep="keep_server_0 keep_server_1"
393     fi
394
395     $DOCKER stop $stop_doc $stop_sso $stop_api $stop_compute $stop_workbench $stop_nameserver $stop_keep $stop_vm \
396         2>/dev/null
397 }
398
399 function do_test {
400     local alltests
401     if [ $# -lt 1 ]
402     then
403         alltests="python-sdk api"
404     else
405         alltests="$@"
406     fi
407
408     for testname in $alltests
409     do
410         echo "testing $testname..."
411         case $testname in
412             python-sdk)
413                 do_start --api --keep --sso
414                 export ARVADOS_API_HOST=$(ip_address "api_server")
415                 export ARVADOS_API_HOST_INSECURE=yes
416                 export ARVADOS_API_TOKEN=$(cat api/generated/superuser_token)
417                 python -m unittest discover ../sdk/python
418                 ;;
419             api)
420                 $DOCKER run -t -i arvados/api \
421                     /usr/src/arvados/services/api/script/rake_test.sh
422                 ;;
423             *)
424                 echo >&2 "unknown test $testname"
425                 ;;
426         esac
427     done
428 }
429
430 if [ $# -lt 1 ]
431 then
432   usage
433   exit 1
434 fi
435
436 case $1 in
437     start)
438         shift
439         do_start $@
440         ;;
441     stop)
442         shift
443         do_stop $@
444         ;;
445     restart)
446         shift
447         do_stop $@
448         do_start $@
449         ;;
450     test)
451         shift
452         do_test $@
453         ;;
454     *)
455         usage
456         exit 1
457         ;;
458 esac