Add --output-tags to arvados-cwl-runner and tests

[arvados.git] / sdk / cwl / arvados_cwl / __init__.py
diff --git a/sdk/cwl/arvados_cwl/__init__.py b/sdk/cwl/arvados_cwl/__init__.py

index e11f6a12a679f0d5cf2b6bf6e6b1726d512637a8..a22b075ce44668a665c7ace08315dd68522b2432 100644 (file)
--- a/sdk/cwl/arvados_cwl/__init__.py
+++ b/sdk/cwl/arvados_cwl/__init__.py
@@ -124,7 +124,8 @@ class ArvCwlRunner(object):
                      try:
                          self.cond.acquire()
                          j = self.processes[uuid]
-                        logger.info("Job %s (%s) is %s", j.name, uuid, event["properties"]["new_attributes"]["state"])
+                        txt = self.work_api[0].upper() + self.work_api[1:-1]
+                        logger.info("%s %s (%s) is %s", txt, j.name, uuid, event["properties"]["new_attributes"]["state"])
                          with Perf(metrics, "done %s" % j.name):
                              j.done(event["properties"]["new_attributes"])
                          self.cond.notify()
@@ -182,7 +183,7 @@ class ArvCwlRunner(object):
              for v in obj:
                  self.check_writable(v)
  
-    def make_output_collection(self, name, outputObj):
+    def make_output_collection(self, name, outputObj, tagsString):
          outputObj = copy.deepcopy(outputObj)
  
          files = []
@@ -233,8 +234,31 @@ class ArvCwlRunner(object):
                      final.api_response()["name"],
                      final.manifest_locator())
  
+        final_uuid = final.manifest_locator()
+        tags = tagsString.split(',')
+        for tag in tags:
+             self.api.links().create(body={"head_uuid": final_uuid, "link_class": "tag", "name": tag}).execute()
+
          self.final_output_collection = final
  
+    def set_crunch_output(self):
+        if self.work_api == "containers":
+            try:
+                current = self.api.containers().current().execute(num_retries=self.num_retries)
+                self.api.containers().update(uuid=current['uuid'],
+                                             body={
+                                                 'output': self.final_output_collection.portable_data_hash(),
+                                             }).execute(num_retries=self.num_retries)
+            except Exception as e:
+                logger.info("Setting container output: %s", e)
+        elif self.work_api == "jobs" and "TASK_UUID" in os.environ:
+            self.api.job_tasks().update(uuid=os.environ["TASK_UUID"],
+                                   body={
+                                       'output': self.final_output_collection.portable_data_hash(),
+                                       'success': self.final_status == "success",
+                                       'progress':1.0
+                                   }).execute(num_retries=self.num_retries)
+
      def arv_executor(self, tool, job_order, **kwargs):
          self.debug = kwargs.get("debug")
  
@@ -363,9 +387,6 @@ class ArvCwlRunner(object):
          if self.final_status == "UnsupportedRequirement":
              raise UnsupportedRequirement("Check log for details.")
  
-        if self.final_status != "success":
-            raise WorkflowException("Workflow failed.")
-
          if self.final_output is None:
              raise WorkflowException("Workflow did not return a result.")
  
@@ -374,7 +395,11 @@ class ArvCwlRunner(object):
          else:
              if self.output_name is None:
                  self.output_name = "Output of %s" % (shortname(tool.tool["id"]))
-            self.make_output_collection(self.output_name, self.final_output)
+            self.make_output_collection(self.output_name, self.final_output, kwargs.get("output_tags", ""))
+            self.set_crunch_output()
+
+        if self.final_status != "success":
+            raise WorkflowException("Workflow failed.")
  
          if kwargs.get("compute_checksum"):
              adjustDirObjs(self.final_output, partial(getListing, self.fs_access))
@@ -428,6 +453,7 @@ def arg_parser():  # type: () -> argparse.ArgumentParser
  
      parser.add_argument("--project-uuid", type=str, metavar="UUID", help="Project that will own the workflow jobs, if not provided, will go to home project.")
      parser.add_argument("--output-name", type=str, help="Name to use for collection that stores the final output.", default=None)
+    parser.add_argument("--output-tags", type=str, help="Tags for the final output collection separated by commas, e.g., '--output-tags tag0,tag1,tag2'.", default=None)
      parser.add_argument("--ignore-docker-for-reuse", action="store_true",
                          help="Ignore Docker image version when deciding whether to reuse past jobs.",
                          default=False)
@@ -449,7 +475,7 @@ def arg_parser():  # type: () -> argparse.ArgumentParser
  
      parser.add_argument("--api", type=str,
                          default=None, dest="work_api",
-                        help="Select work submission API, one of 'jobs' or 'containers'.")
+                        help="Select work submission API, one of 'jobs' or 'containers'. Default is 'jobs' if that API is available, otherwise 'containers'.")
  
      parser.add_argument("--compute-checksum", action="store_true", default=False,
                          help="Compute checksum of contents while collecting outputs",