16552: Use sdnotify to signal to systemd that service is up.
[arvados.git] / lib / boot / cmd.go
1 // Copyright (C) The Arvados Authors. All rights reserved.
2 //
3 // SPDX-License-Identifier: AGPL-3.0
4
5 package boot
6
7 import (
8         "context"
9         "errors"
10         "flag"
11         "fmt"
12         "io"
13         "sort"
14         "time"
15
16         "git.arvados.org/arvados.git/lib/cmd"
17         "git.arvados.org/arvados.git/sdk/go/ctxlog"
18         "github.com/coreos/go-systemd/daemon"
19 )
20
21 var Command cmd.Handler = bootCommand{}
22
23 type supervisedTask interface {
24         // Execute the task. Run should return nil when the task is
25         // done enough to satisfy a dependency relationship (e.g., the
26         // service is running and ready). If the task starts a
27         // goroutine that fails after Run returns (e.g., the service
28         // shuts down), it should call fail().
29         Run(ctx context.Context, fail func(error), super *Supervisor) error
30         String() string
31 }
32
33 var errNeedConfigReload = errors.New("config changed, restart needed")
34 var errParseFlags = errors.New("error parsing command line arguments")
35
36 type bootCommand struct{}
37
38 func (bcmd bootCommand) RunCommand(prog string, args []string, stdin io.Reader, stdout, stderr io.Writer) int {
39         logger := ctxlog.New(stderr, "json", "info")
40         ctx := ctxlog.Context(context.Background(), logger)
41         for {
42                 err := bcmd.run(ctx, prog, args, stdin, stdout, stderr)
43                 if err == errNeedConfigReload {
44                         continue
45                 } else if err == errParseFlags {
46                         return 2
47                 } else if err != nil {
48                         logger.WithError(err).Info("exiting")
49                         return 1
50                 } else {
51                         return 0
52                 }
53         }
54 }
55
56 func (bcmd bootCommand) run(ctx context.Context, prog string, args []string, stdin io.Reader, stdout, stderr io.Writer) error {
57         ctx, cancel := context.WithCancel(ctx)
58         defer cancel()
59         super := &Supervisor{
60                 Stdin:  stdin,
61                 Stderr: stderr,
62                 logger: ctxlog.FromContext(ctx),
63         }
64
65         flags := flag.NewFlagSet(prog, flag.ContinueOnError)
66         versionFlag := flags.Bool("version", false, "Write version information to stdout and exit 0")
67         flags.StringVar(&super.ConfigPath, "config", "/etc/arvados/config.yml", "arvados config file `path`")
68         flags.StringVar(&super.SourcePath, "source", ".", "arvados source tree `directory`")
69         flags.StringVar(&super.ClusterType, "type", "production", "cluster `type`: development, test, or production")
70         flags.StringVar(&super.ListenHost, "listen-host", "localhost", "host name or interface address for internal services whose InternalURLs are not configured")
71         flags.StringVar(&super.ControllerAddr, "controller-address", ":0", "desired controller address, `host:port` or `:port`")
72         flags.StringVar(&super.Workbench2Source, "workbench2-source", "../arvados-workbench2", "path to arvados-workbench2 source tree")
73         flags.BoolVar(&super.NoWorkbench1, "no-workbench1", false, "do not run workbench1")
74         flags.BoolVar(&super.NoWorkbench2, "no-workbench2", false, "do not run workbench2")
75         flags.BoolVar(&super.OwnTemporaryDatabase, "own-temporary-database", false, "bring up a postgres server and create a temporary database")
76         timeout := flags.Duration("timeout", 0, "maximum time to wait for cluster to be ready")
77         shutdown := flags.Bool("shutdown", false, "shut down when the cluster becomes ready")
78         if ok, code := cmd.ParseFlags(flags, prog, args, "", stderr); !ok {
79                 if code == 0 {
80                         return nil
81                 } else {
82                         return errParseFlags
83                 }
84         } else if *versionFlag {
85                 cmd.Version.RunCommand(prog, args, stdin, stdout, stderr)
86                 return nil
87         } else if super.ClusterType != "development" && super.ClusterType != "test" && super.ClusterType != "production" {
88                 return fmt.Errorf("cluster type must be 'development', 'test', or 'production'")
89         }
90
91         super.Start(ctx)
92         defer super.Stop()
93
94         var timer *time.Timer
95         if *timeout > 0 {
96                 timer = time.AfterFunc(*timeout, super.Stop)
97         }
98
99         ok := super.WaitReady()
100         if timer != nil && !timer.Stop() {
101                 return errors.New("boot timed out")
102         } else if !ok {
103                 super.logger.Error("boot failed")
104         } else {
105                 // Write each cluster's controller URL, id, and URL
106                 // host:port to stdout.  Nothing else goes to stdout,
107                 // so this allows a calling script to determine when
108                 // the cluster is ready to use, and the controller's
109                 // host:port (which may have been dynamically assigned
110                 // depending on config/options).
111                 //
112                 // Sort output by cluster ID for convenience.
113                 var ids []string
114                 for id := range super.Clusters() {
115                         ids = append(ids, id)
116                 }
117                 sort.Strings(ids)
118                 for _, id := range ids {
119                         cc := super.Cluster(id)
120                         // Providing both scheme://host:port and
121                         // host:port is redundant, but convenient.
122                         fmt.Fprintln(stdout, cc.Services.Controller.ExternalURL, id, cc.Services.Controller.ExternalURL.Host)
123                 }
124                 // Write ".\n" to mark the end of the list of
125                 // controllers, in case the caller doesn't already
126                 // know how many clusters are coming up.
127                 fmt.Fprintln(stdout, ".")
128                 if *shutdown {
129                         super.Stop()
130                         // Wait for children to exit. Don't report the
131                         // ensuing "context cancelled" error, though:
132                         // return nil to indicate successful startup.
133                         _ = super.Wait()
134                         fmt.Fprintln(stderr, "PASS - all services booted successfully")
135                         return nil
136                 }
137         }
138         if _, err := daemon.SdNotify(false, "READY=1"); err != nil {
139                 super.logger.WithError(err).Errorf("error notifying init daemon")
140         }
141         // Wait for signal/crash + orderly shutdown
142         return super.Wait()
143 }