Updating not-in-use directory
[arvados-tutorial.git] / WGS-processing / README
1 This directory contains an Arvados demo showing processing of whole genome sequencing (WGS) data. The workflow includes:
2
3 * Check of fastq quality 
4 * Local alignment using BWA-MEM
5 * Variant calling in parallel using GATK
6 * Generation of an HTML report comparing variants against ClinVar archive 
7
8 Workflows are written in CWL v1.1. 
9
10 Subdirectories are:
11 cwl - contains CWL code for the demo
12 yml - contains yml inputs for cwl demo code
13 src - contains any src code for the demo
14 docker - contains dockerfiles necessary to re-create any needed docker images 
15
16 To run the workflow:
17
18 1. cd into cwl directory
19
20 2. run the following:
21 arvados-cwl-runner --no-wait --project-uuid YOUR_PROJECT_UUID wgs-processing-wf.cwl ../yml/YOURINPUTS.yml
22
23 About the Demo Data:
24 WGS Data used in this demo is public data made available by the Personal Genome Project.  This data is from the PGP-UK (https://www.personalgenomes.org.uk/).