Merge branch '3212-pipeline-no-reuse' closes #3212
[arvados.git] / sdk / python / bin / arv-normalize
1 #!/usr/bin/env python
2
3 import argparse
4 import hashlib
5 import os
6 import re
7 import string
8 import sys
9 import logging
10
11 logger = logging.getLogger(os.path.basename(sys.argv[0]))
12
13 parser = argparse.ArgumentParser(
14     description='Read manifest on standard input and put normalized manifest on standard output.')
15
16 parser.add_argument('--extract', type=str, help="The file to extract from the input manifest")
17 parser.add_argument('--strip', action='store_true', help="Strip authorization tokens")
18
19 args = parser.parse_args()
20
21 import arvados
22
23 r = sys.stdin.read()
24
25 cr = arvados.CollectionReader(r)
26
27 if args.extract:
28     i = args.extract.rfind('/')
29     if i == -1:
30         stream = '.'
31         fn = args.extract
32     else:
33         stream = args.extract[:i]
34         fn = args.extract[(i+1):]
35     for s in cr.all_streams():
36         if s.name() == stream:
37             if fn in s.files():
38                 sys.stdout.write(s.files()[fn].as_manifest())
39 else:
40     sys.stdout.write(cr.manifest_text(args.strip))