19099: Refactor container shell backend so it's not docker-specific.
[arvados.git] / services / keepstore / pull_worker.go
index b68e93313027c0480e8f17d6ca78b42ad3f8065d..abe3dc3857d5a1652562f29bc361b4f2c95e49ca 100644 (file)
-package main
+// Copyright (C) The Arvados Authors. All rights reserved.
+//
+// SPDX-License-Identifier: AGPL-3.0
+
+package keepstore
 
 import (
-       "crypto/rand"
-       "errors"
+       "context"
        "fmt"
-       "git.curoverse.com/arvados.git/sdk/go/arvadosclient"
-       "git.curoverse.com/arvados.git/sdk/go/keepclient"
+       "io"
        "io/ioutil"
-       "log"
-       "os"
-       "strconv"
        "time"
-)
 
-var arv arvadosclient.ArvadosClient
-var keepClient keepclient.KeepClient
-
-/*
-       Keepstore initiates pull worker channel goroutine.
-       The channel will process pull list.
-               For each (next) pull request:
-                       For each locator listed, execute Pull on the server(s) listed
-                       Skip the rest of the servers if no errors
-               Repeat
-*/
-func RunPullWorker(nextItem <-chan interface{}) {
-       var err error
-       arv, err = arvadosclient.MakeArvadosClient()
-       if err != nil {
-               log.Fatalf("Error setting up arvados client %s", err.Error())
-       }
-       arv.ApiToken = os.Getenv("ARVADOS_API_TOKEN")
-
-       keepClient, err = keepclient.MakeKeepClient(&arv)
-       if err != nil {
-               log.Fatalf("Error setting up keep client %s", err.Error())
-       }
+       "git.arvados.org/arvados.git/sdk/go/keepclient"
+)
 
-       for item := range nextItem {
-               pullReq := item.(PullRequest)
-               for _, addr := range pullReq.Servers {
-                       err := Pull(addr, pullReq.Locator)
-                       if err == nil {
-                               break
-                       }
+// RunPullWorker receives PullRequests from pullq, invokes
+// PullItemAndProcess on each one. After each PR, it logs a message
+// indicating whether the pull was successful.
+func (h *handler) runPullWorker(pullq *WorkQueue) {
+       for item := range pullq.NextItem {
+               pr := item.(PullRequest)
+               err := h.pullItemAndProcess(pr)
+               pullq.DoneItem <- struct{}{}
+               if err == nil {
+                       h.Logger.Printf("Pull %s success", pr)
+               } else {
+                       h.Logger.Printf("Pull %s error: %s", pr, err)
                }
        }
 }
 
-/*
-       For each Pull request:
-               Generate a random API token.
-               Generate a permission signature using this token, timestamp ~60 seconds in the future, and desired block hash.
-               Using this token & signature, retrieve the given block.
-               Write to storage
-*/
-func Pull(addr string, locator string) (err error) {
-       log.Printf("Pull %s/%s starting", addr, locator)
-
-       defer func() {
-               if err == nil {
-                       log.Printf("Pull %s/%s success", addr, locator)
-               } else {
-                       log.Printf("Pull %s/%s error: %s", addr, locator, err)
+// PullItemAndProcess executes a pull request by retrieving the
+// specified block from one of the specified servers, and storing it
+// on a local volume.
+//
+// If the PR specifies a non-blank mount UUID, PullItemAndProcess will
+// only attempt to write the data to the corresponding
+// volume. Otherwise it writes to any local volume, as a PUT request
+// would.
+func (h *handler) pullItemAndProcess(pullRequest PullRequest) error {
+       var vol *VolumeMount
+       if uuid := pullRequest.MountUUID; uuid != "" {
+               vol = h.volmgr.Lookup(pullRequest.MountUUID, true)
+               if vol == nil {
+                       return fmt.Errorf("pull req has nonexistent mount: %v", pullRequest)
                }
-       }()
-
-       service_roots := make(map[string]string)
-       service_roots[locator] = addr
-       keepClient.SetServiceRoots(service_roots)
-
-       read_content, err := GetContent(addr, locator)
-       log.Print(read_content, err)
-       if err != nil {
-               return
        }
 
-       err = PutContent(read_content, locator)
-       return
-}
+       // Make a private copy of keepClient so we can set
+       // ServiceRoots to the source servers specified in the pull
+       // request.
+       keepClient := *h.keepClient
+       serviceRoots := make(map[string]string)
+       for _, addr := range pullRequest.Servers {
+               serviceRoots[addr] = addr
+       }
+       keepClient.SetServiceRoots(serviceRoots, nil, nil)
 
-// Fetch the content for the given locator using keepclient.
-var GetContent = func(addr string, locator string) ([]byte, error) {
-       // Generate signature with a random token
-       expires_at := time.Now().Unix() + 60 // now + 1 min in seconds
-       hints := "+A" + GenerateRandomApiToken() + "@" + strconv.FormatInt(expires_at, 16)
-       signature := keepclient.MakeLocator2(locator, hints)
+       signedLocator := SignLocator(h.Cluster, pullRequest.Locator, keepClient.Arvados.ApiToken, time.Now().Add(time.Minute))
 
-       reader, blocklen, _, err := keepClient.AuthorizedGet(locator, signature.Signature, signature.Timestamp)
-       defer reader.Close()
+       reader, contentLen, _, err := GetContent(signedLocator, &keepClient)
        if err != nil {
-               return nil, err
+               return err
+       }
+       if reader == nil {
+               return fmt.Errorf("No reader found for : %s", signedLocator)
        }
+       defer reader.Close()
 
-       read_content, err := ioutil.ReadAll(reader)
-       log.Print(read_content, err)
+       readContent, err := ioutil.ReadAll(reader)
        if err != nil {
-               return nil, err
+               return err
        }
 
-       if (read_content == nil) || (int64(len(read_content)) != blocklen) {
-               return nil, errors.New(fmt.Sprintf("Content not found for: %s/%s", addr, locator))
+       if (readContent == nil) || (int64(len(readContent)) != contentLen) {
+               return fmt.Errorf("Content not found for: %s", signedLocator)
        }
 
-       return read_content, nil
+       return writePulledBlock(h.volmgr, vol, readContent, pullRequest.Locator)
 }
 
-const ALPHA_NUMERIC = "0123456789abcdefghijklmnopqrstuvwxyz"
-
-func GenerateRandomApiToken() string {
-       var bytes = make([]byte, 36)
-       rand.Read(bytes)
-       for i, b := range bytes {
-               bytes[i] = ALPHA_NUMERIC[b%byte(len(ALPHA_NUMERIC))]
-       }
-       return (string(bytes))
+// GetContent fetches the content for the given locator using keepclient.
+var GetContent = func(signedLocator string, keepClient *keepclient.KeepClient) (io.ReadCloser, int64, string, error) {
+       return keepClient.Get(signedLocator)
 }
 
-// Put block
-var PutContent = func(content []byte, locator string) (err error) {
-       err = PutBlock(content, locator)
-       return
+var writePulledBlock = func(volmgr *RRVolumeManager, volume Volume, data []byte, locator string) error {
+       if volume != nil {
+               return volume.Put(context.Background(), locator, data)
+       }
+       _, err := PutBlock(context.Background(), volmgr, data, locator, nil)
+       return err
 }