Merge branch 'master' into 3990-owner-when-rerunning-pipeline
[arvados.git] / sdk / python / bin / arv-normalize
1 #!/usr/bin/env python
2
3 import argparse
4 import hashlib
5 import os
6 import re
7 import string
8 import sys
9
10 parser = argparse.ArgumentParser(
11     description='Read manifest on standard input and put normalized manifest on standard output.')
12
13 parser.add_argument('--extract', type=str, help="The file to extract from the input manifest")
14 parser.add_argument('--strip', action='store_true', help="Strip authorization tokens")
15
16 args = parser.parse_args()
17
18 import arvados
19
20 r = sys.stdin.read()
21
22 cr = arvados.CollectionReader(r)
23
24 if args.extract:
25     i = args.extract.rfind('/')
26     if i == -1:
27         stream = '.'
28         fn = args.extract
29     else:
30         stream = args.extract[:i]
31         fn = args.extract[(i+1):]
32     for s in cr.all_streams():
33         if s.name() == stream:
34             if fn in s.files():
35                 sys.stdout.write(s.files()[fn].as_manifest())
36 else:
37     sys.stdout.write(cr.manifest_text(args.strip))