10383: Merge branch 'master' into 10383-arv-put-incremental-upload
[arvados.git] / sdk / go / arvadosclient / arvadosclient.go
index 99b08186a533f101a88f0ca3910cc1fcbe06ab3d..021b9471ff93814b81c933923e819f821efd8f1b 100644 (file)
@@ -5,20 +5,38 @@ package arvadosclient
 import (
        "bytes"
        "crypto/tls"
+       "crypto/x509"
        "encoding/json"
        "errors"
        "fmt"
        "io"
+       "io/ioutil"
        "net/http"
        "net/url"
        "os"
        "regexp"
        "strings"
+       "time"
+
+       "git.curoverse.com/arvados.git/sdk/go/arvados"
 )
 
-// Errors
+type StringMatcher func(string) bool
+
+var UUIDMatch StringMatcher = regexp.MustCompile(`^[a-z0-9]{5}-[a-z0-9]{5}-[a-z0-9]{15}$`).MatchString
+var PDHMatch StringMatcher = regexp.MustCompile(`^[0-9a-f]{32}\+\d+$`).MatchString
+
 var MissingArvadosApiHost = errors.New("Missing required environment variable ARVADOS_API_HOST")
 var MissingArvadosApiToken = errors.New("Missing required environment variable ARVADOS_API_TOKEN")
+var ErrInvalidArgument = errors.New("Invalid argument")
+
+// A common failure mode is to reuse a keepalive connection that has been
+// terminated (in a way that we can't detect) for being idle too long.
+// POST and DELETE are not safe to retry automatically, so we minimize
+// such failures by always using a new or recently active socket.
+var MaxIdleConnectionDuration = 30 * time.Second
+
+var RetryDelay = 2 * time.Second
 
 // Indicates an error that was returned by the API server.
 type APIServerError struct {
@@ -53,6 +71,9 @@ type Dict map[string]interface{}
 
 // Information about how to contact the Arvados server
 type ArvadosClient struct {
+       // https
+       Scheme string
+
        // Arvados API server, form "host:port"
        ApiServer string
 
@@ -69,25 +90,102 @@ type ArvadosClient struct {
        // the client is outside the cluster.
        External bool
 
+       // Base URIs of Keep services, e.g., {"https://host1:8443",
+       // "https://host2:8443"}.  If this is nil, Keep clients will
+       // use the arvados.v1.keep_services.accessible API to discover
+       // available services.
+       KeepServiceURIs []string
+
        // Discovery document
        DiscoveryDoc Dict
+
+       lastClosedIdlesAt time.Time
+
+       // Number of retries
+       Retries int
+}
+
+var CertFiles = []string{
+       "/etc/arvados/ca-certificates.crt",
+       "/etc/ssl/certs/ca-certificates.crt", // Debian/Ubuntu/Gentoo etc.
+       "/etc/pki/tls/certs/ca-bundle.crt",   // Fedora/RHEL
+}
+
+// MakeTLSConfig sets up TLS configuration for communicating with Arvados and Keep services.
+func MakeTLSConfig(insecure bool) *tls.Config {
+       tlsconfig := tls.Config{InsecureSkipVerify: insecure}
+
+       if !insecure {
+               // Look for /etc/arvados/ca-certificates.crt in addition to normal system certs.
+               certs := x509.NewCertPool()
+               for _, file := range CertFiles {
+                       data, err := ioutil.ReadFile(file)
+                       if err == nil {
+                               success := certs.AppendCertsFromPEM(data)
+                               if !success {
+                                       fmt.Printf("Unable to load any certificates from %v", file)
+                               } else {
+                                       tlsconfig.RootCAs = certs
+                                       break
+                               }
+                       }
+               }
+               // Will use system default CA roots instead.
+       }
+
+       return &tlsconfig
 }
 
-// Create a new ArvadosClient, initialized with standard Arvados environment
-// variables ARVADOS_API_HOST, ARVADOS_API_TOKEN, and (optionally)
-// ARVADOS_API_HOST_INSECURE.
-func MakeArvadosClient() (ac ArvadosClient, err error) {
+// New returns an ArvadosClient using the given arvados.Client
+// configuration. This is useful for callers who load arvados.Client
+// fields from configuration files but still need to use the
+// arvadosclient.ArvadosClient package.
+func New(c *arvados.Client) (*ArvadosClient, error) {
+       ac := &ArvadosClient{
+               Scheme:      "https",
+               ApiServer:   c.APIHost,
+               ApiToken:    c.AuthToken,
+               ApiInsecure: c.Insecure,
+               Client: &http.Client{Transport: &http.Transport{
+                       TLSClientConfig: MakeTLSConfig(c.Insecure)}},
+               External:          false,
+               Retries:           2,
+               lastClosedIdlesAt: time.Now(),
+       }
+
+       return ac, nil
+}
+
+// MakeArvadosClient creates a new ArvadosClient using the standard
+// environment variables ARVADOS_API_HOST, ARVADOS_API_TOKEN,
+// ARVADOS_API_HOST_INSECURE, ARVADOS_EXTERNAL_CLIENT, and
+// ARVADOS_KEEP_SERVICES.
+func MakeArvadosClient() (ac *ArvadosClient, err error) {
        var matchTrue = regexp.MustCompile("^(?i:1|yes|true)$")
        insecure := matchTrue.MatchString(os.Getenv("ARVADOS_API_HOST_INSECURE"))
        external := matchTrue.MatchString(os.Getenv("ARVADOS_EXTERNAL_CLIENT"))
 
-       ac = ArvadosClient{
+       ac = &ArvadosClient{
+               Scheme:      "https",
                ApiServer:   os.Getenv("ARVADOS_API_HOST"),
                ApiToken:    os.Getenv("ARVADOS_API_TOKEN"),
                ApiInsecure: insecure,
                Client: &http.Client{Transport: &http.Transport{
-                       TLSClientConfig: &tls.Config{InsecureSkipVerify: insecure}}},
-               External: external}
+                       TLSClientConfig: MakeTLSConfig(insecure)}},
+               External: external,
+               Retries:  2}
+
+       for _, s := range strings.Split(os.Getenv("ARVADOS_KEEP_SERVICES"), " ") {
+               if s == "" {
+                       continue
+               }
+               if u, err := url.Parse(s); err != nil {
+                       return ac, fmt.Errorf("ARVADOS_KEEP_SERVICES: %q: %s", s, err)
+               } else if !u.IsAbs() {
+                       return ac, fmt.Errorf("ARVADOS_KEEP_SERVICES: %q: not an absolute URI", s)
+               }
+               ac.KeepServiceURIs = append(ac.KeepServiceURIs, s)
+       }
 
        if ac.ApiServer == "" {
                return ac, MissingArvadosApiHost
@@ -96,33 +194,28 @@ func MakeArvadosClient() (ac ArvadosClient, err error) {
                return ac, MissingArvadosApiToken
        }
 
+       ac.lastClosedIdlesAt = time.Now()
+
        return ac, err
 }
 
-// Low-level access to a resource.
-//
-//   method - HTTP method, one of GET, HEAD, PUT, POST or DELETE
-//   resource - the arvados resource to act on
-//   uuid - the uuid of the specific item to access (may be empty)
-//   action - sub-action to take on the resource or uuid (may be empty)
-//   parameters - method parameters
-//
-// return
-//   reader - the body reader, or nil if there was an error
-//   err - error accessing the resource, or nil if no error
-func (this ArvadosClient) CallRaw(method string, resource string, uuid string, action string, parameters Dict) (reader io.ReadCloser, err error) {
-       var req *http.Request
-
+// CallRaw is the same as Call() but returns a Reader that reads the
+// response body, instead of taking an output object.
+func (c *ArvadosClient) CallRaw(method string, resourceType string, uuid string, action string, parameters Dict) (reader io.ReadCloser, err error) {
+       scheme := c.Scheme
+       if scheme == "" {
+               scheme = "https"
+       }
        u := url.URL{
-               Scheme: "https",
-               Host:   this.ApiServer}
+               Scheme: scheme,
+               Host:   c.ApiServer}
 
-       if resource != API_DISCOVERY_RESOURCE {
+       if resourceType != API_DISCOVERY_RESOURCE {
                u.Path = "/arvados/v1"
        }
 
-       if resource != "" {
-               u.Path = u.Path + "/" + resource
+       if resourceType != "" {
+               u.Path = u.Path + "/" + resourceType
        }
        if uuid != "" {
                u.Path = u.Path + "/" + uuid
@@ -135,46 +228,82 @@ func (this ArvadosClient) CallRaw(method string, resource string, uuid string, a
                parameters = make(Dict)
        }
 
-       parameters["format"] = "json"
-
        vals := make(url.Values)
        for k, v := range parameters {
-               m, err := json.Marshal(v)
-               if err == nil {
+               if s, ok := v.(string); ok {
+                       vals.Set(k, s)
+               } else if m, err := json.Marshal(v); err == nil {
                        vals.Set(k, string(m))
                }
        }
 
-       if method == "GET" || method == "HEAD" {
-               u.RawQuery = vals.Encode()
-               if req, err = http.NewRequest(method, u.String(), nil); err != nil {
-                       return nil, err
-               }
-       } else {
-               if req, err = http.NewRequest(method, u.String(), bytes.NewBufferString(vals.Encode())); err != nil {
-                       return nil, err
-               }
-               req.Header.Add("Content-Type", "application/x-www-form-urlencoded")
+       retryable := false
+       switch method {
+       case "GET", "HEAD", "PUT", "OPTIONS", "DELETE":
+               retryable = true
        }
 
-       // Add api token header
-       req.Header.Add("Authorization", fmt.Sprintf("OAuth2 %s", this.ApiToken))
-       if this.External {
-               req.Header.Add("X-External-Client", "1")
+       // Non-retryable methods such as POST are not safe to retry automatically,
+       // so we minimize such failures by always using a new or recently active socket
+       if !retryable {
+               if time.Since(c.lastClosedIdlesAt) > MaxIdleConnectionDuration {
+                       c.lastClosedIdlesAt = time.Now()
+                       c.Client.Transport.(*http.Transport).CloseIdleConnections()
+               }
        }
 
        // Make the request
+       var req *http.Request
        var resp *http.Response
-       if resp, err = this.Client.Do(req); err != nil {
-               return nil, err
-       }
 
-       if resp.StatusCode == http.StatusOK {
-               return resp.Body, nil
+       for attempt := 0; attempt <= c.Retries; attempt++ {
+               if method == "GET" || method == "HEAD" {
+                       u.RawQuery = vals.Encode()
+                       if req, err = http.NewRequest(method, u.String(), nil); err != nil {
+                               return nil, err
+                       }
+               } else {
+                       if req, err = http.NewRequest(method, u.String(), bytes.NewBufferString(vals.Encode())); err != nil {
+                               return nil, err
+                       }
+                       req.Header.Add("Content-Type", "application/x-www-form-urlencoded")
+               }
+
+               // Add api token header
+               req.Header.Add("Authorization", fmt.Sprintf("OAuth2 %s", c.ApiToken))
+               if c.External {
+                       req.Header.Add("X-External-Client", "1")
+               }
+
+               resp, err = c.Client.Do(req)
+               if err != nil {
+                       if retryable {
+                               time.Sleep(RetryDelay)
+                               continue
+                       } else {
+                               return nil, err
+                       }
+               }
+
+               if resp.StatusCode == http.StatusOK {
+                       return resp.Body, nil
+               }
+
+               defer resp.Body.Close()
+
+               switch resp.StatusCode {
+               case 408, 409, 422, 423, 500, 502, 503, 504:
+                       time.Sleep(RetryDelay)
+                       continue
+               default:
+                       return nil, newAPIServerError(c.ApiServer, resp)
+               }
        }
 
-       defer resp.Body.Close()
-       return nil, newAPIServerError(this.ApiServer, resp)
+       if resp != nil {
+               return nil, newAPIServerError(c.ApiServer, resp)
+       }
+       return nil, err
 }
 
 func newAPIServerError(ServerAddress string, resp *http.Response) APIServerError {
@@ -206,19 +335,20 @@ func newAPIServerError(ServerAddress string, resp *http.Response) APIServerError
        return ase
 }
 
-// Access to a resource.
+// Call an API endpoint and parse the JSON response into an object.
 //
-//   method - HTTP method, one of GET, HEAD, PUT, POST or DELETE
-//   resource - the arvados resource to act on
-//   uuid - the uuid of the specific item to access (may be empty)
-//   action - sub-action to take on the resource or uuid (may be empty)
-//   parameters - method parameters
-//   output - a map or annotated struct which is a legal target for encoding/json/Decoder
-// return
-//   err - error accessing the resource, or nil if no error
-func (this ArvadosClient) Call(method string, resource string, uuid string, action string, parameters Dict, output interface{}) (err error) {
-       var reader io.ReadCloser
-       reader, err = this.CallRaw(method, resource, uuid, action, parameters)
+//   method - HTTP method: GET, HEAD, PUT, POST, PATCH or DELETE.
+//   resourceType - the type of arvados resource to act on (e.g., "collections", "pipeline_instances").
+//   uuid - the uuid of the specific item to access. May be empty.
+//   action - API method name (e.g., "lock"). This is often empty if implied by method and uuid.
+//   parameters - method parameters.
+//   output - a map or annotated struct which is a legal target for encoding/json/Decoder.
+//
+// Returns a non-nil error if an error occurs making the API call, the
+// API responds with a non-successful HTTP status, or an error occurs
+// parsing the response body.
+func (c *ArvadosClient) Call(method, resourceType, uuid, action string, parameters Dict, output interface{}) error {
+       reader, err := c.CallRaw(method, resourceType, uuid, action, parameters)
        if reader != nil {
                defer reader.Close()
        }
@@ -235,74 +365,58 @@ func (this ArvadosClient) Call(method string, resource string, uuid string, acti
        return nil
 }
 
-// Create a new instance of a resource.
-//
-//   resource - the arvados resource on which to create an item
-//   parameters - method parameters
-//   output - a map or annotated struct which is a legal target for encoding/json/Decoder
-// return
-//   err - error accessing the resource, or nil if no error
-func (this ArvadosClient) Create(resource string, parameters Dict, output interface{}) (err error) {
-       return this.Call("POST", resource, "", "", parameters, output)
+// Create a new resource. See Call for argument descriptions.
+func (c *ArvadosClient) Create(resourceType string, parameters Dict, output interface{}) error {
+       return c.Call("POST", resourceType, "", "", parameters, output)
 }
 
-// Delete an instance of a resource.
-//
-//   resource - the arvados resource on which to delete an item
-//   uuid - the item to delete
-//   parameters - method parameters
-//   output - a map or annotated struct which is a legal target for encoding/json/Decoder
-// return
-//   err - error accessing the resource, or nil if no error
-func (this ArvadosClient) Delete(resource string, uuid string, parameters Dict, output interface{}) (err error) {
-       return this.Call("DELETE", resource, uuid, "", parameters, output)
+// Delete a resource. See Call for argument descriptions.
+func (c *ArvadosClient) Delete(resource string, uuid string, parameters Dict, output interface{}) (err error) {
+       return c.Call("DELETE", resource, uuid, "", parameters, output)
 }
 
-// Update fields of an instance of a resource.
-//
-//   resource - the arvados resource on which to update the item
-//   uuid - the item to update
-//   parameters - method parameters
-//   output - a map or annotated struct which is a legal target for encoding/json/Decoder
-// return
-//   err - error accessing the resource, or nil if no error
-func (this ArvadosClient) Update(resource string, uuid string, parameters Dict, output interface{}) (err error) {
-       return this.Call("PUT", resource, uuid, "", parameters, output)
+// Modify attributes of a resource. See Call for argument descriptions.
+func (c *ArvadosClient) Update(resourceType string, uuid string, parameters Dict, output interface{}) (err error) {
+       return c.Call("PUT", resourceType, uuid, "", parameters, output)
 }
 
-// List the instances of a resource
-//
-//   resource - the arvados resource on which to list
-//   parameters - method parameters
-//   output - a map or annotated struct which is a legal target for encoding/json/Decoder
-// return
-//   err - error accessing the resource, or nil if no error
-func (this ArvadosClient) List(resource string, parameters Dict, output interface{}) (err error) {
-       return this.Call("GET", resource, "", "", parameters, output)
+// Get a resource. See Call for argument descriptions.
+func (c *ArvadosClient) Get(resourceType string, uuid string, parameters Dict, output interface{}) (err error) {
+       if !UUIDMatch(uuid) && !(resourceType == "collections" && PDHMatch(uuid)) {
+               // No object has uuid == "": there is no need to make
+               // an API call. Furthermore, the HTTP request for such
+               // an API call would be "GET /arvados/v1/type/", which
+               // is liable to be misinterpreted as the List API.
+               return ErrInvalidArgument
+       }
+       return c.Call("GET", resourceType, uuid, "", parameters, output)
 }
 
-// API Discovery
-//
-//   parameter - name of parameter to be discovered
-// return
-//   value - value of the discovered parameter
-//   err - error accessing the resource, or nil if no error
-var API_DISCOVERY_RESOURCE string = "discovery/v1/apis/arvados/v1/rest"
-
-func (this *ArvadosClient) Discovery(parameter string) (value interface{}, err error) {
-       if len(this.DiscoveryDoc) == 0 {
-               this.DiscoveryDoc = make(Dict)
-               err = this.Call("GET", API_DISCOVERY_RESOURCE, "", "", nil, &this.DiscoveryDoc)
+// List resources of a given type. See Call for argument descriptions.
+func (c *ArvadosClient) List(resource string, parameters Dict, output interface{}) (err error) {
+       return c.Call("GET", resource, "", "", parameters, output)
+}
+
+const API_DISCOVERY_RESOURCE = "discovery/v1/apis/arvados/v1/rest"
+
+// Discovery returns the value of the given parameter in the discovery
+// document. Returns a non-nil error if the discovery document cannot
+// be retrieved/decoded. Returns ErrInvalidArgument if the requested
+// parameter is not found in the discovery document.
+func (c *ArvadosClient) Discovery(parameter string) (value interface{}, err error) {
+       if len(c.DiscoveryDoc) == 0 {
+               c.DiscoveryDoc = make(Dict)
+               err = c.Call("GET", API_DISCOVERY_RESOURCE, "", "", nil, &c.DiscoveryDoc)
                if err != nil {
                        return nil, err
                }
        }
 
        var found bool
-       value, found = this.DiscoveryDoc[parameter]
+       value, found = c.DiscoveryDoc[parameter]
        if found {
                return value, nil
        } else {
-               return value, errors.New("Not found")
+               return value, ErrInvalidArgument
        }
 }