Merge branch '8784-dir-listings'
[arvados.git] / tools / crunchstat-summary / crunchstat_summary / command.py
1 # Copyright (C) The Arvados Authors. All rights reserved.
2 #
3 # SPDX-License-Identifier: AGPL-3.0
4
5 import argparse
6 import gzip
7 import logging
8 import sys
9
10 from crunchstat_summary import logger, summarizer
11
12
13 class ArgumentParser(argparse.ArgumentParser):
14     def __init__(self):
15         super(ArgumentParser, self).__init__(
16             description='Summarize resource usage of an Arvados Crunch job')
17         src = self.add_mutually_exclusive_group()
18         src.add_argument(
19             '--job', type=str, metavar='UUID',
20             help='Look up the specified job and read its log data from Keep'
21             ' (or from the Arvados event log, if the job is still running)')
22         src.add_argument(
23             '--pipeline-instance', type=str, metavar='UUID',
24             help='Summarize each component of the given pipeline instance')
25         src.add_argument(
26             '--log-file', type=str,
27             help='Read log data from a regular file')
28         self.add_argument(
29             '--skip-child-jobs', action='store_true',
30             help='Do not include stats from child jobs')
31         self.add_argument(
32             '--format', type=str, choices=('html', 'text'), default='text',
33             help='Report format')
34         self.add_argument(
35             '--verbose', '-v', action='count', default=0,
36             help='Log more information (once for progress, twice for debug)')
37
38
39 class Command(object):
40     def __init__(self, args):
41         self.args = args
42         logger.setLevel(logging.WARNING - 10 * args.verbose)
43
44     def run(self):
45         kwargs = {
46             'skip_child_jobs': self.args.skip_child_jobs,
47         }
48         if self.args.pipeline_instance:
49             self.summer = summarizer.PipelineSummarizer(self.args.pipeline_instance, **kwargs)
50         elif self.args.job:
51             self.summer = summarizer.JobSummarizer(self.args.job, **kwargs)
52         elif self.args.log_file:
53             if self.args.log_file.endswith('.gz'):
54                 fh = gzip.open(self.args.log_file)
55             else:
56                 fh = open(self.args.log_file)
57             self.summer = summarizer.Summarizer(fh, **kwargs)
58         else:
59             self.summer = summarizer.Summarizer(sys.stdin, **kwargs)
60         return self.summer.run()
61
62     def report(self):
63         if self.args.format == 'html':
64             return self.summer.html_report()
65         elif self.args.format == 'text':
66             return self.summer.text_report()