fix(provision): improve single host installation and documentation
[arvados.git] / doc / install / salt-single-host.html.textile.liquid
1 ---
2 layout: default
3 navsection: installguide
4 title: Single host Arvados
5 ...
6 {% comment %}
7 Copyright (C) The Arvados Authors. All rights reserved.
8
9 SPDX-License-Identifier: CC-BY-SA-3.0
10 {% endcomment %}
11
12 # "Single host install using the provision.sh script":#single_host
13 # "Choose the desired configuration":#choose_configuration
14 ## "Single host / single hostname":#single_host_single_hostnames
15 ## "Single host / multiple hostnames (Alternative configuration)":#single_host_multiple_hostnames
16 ## "Further customization of the installation (modifying the salt pillars and states)":#further_customization
17 # "Run the provision.sh script":#run_provision_script
18 # "Final configuration steps":#final_steps
19 ## "Install the CA root certificate (required in both alternatives)":#ca_root_certificate
20 ## "DNS configuration (single host / multiple hostnames)":#single_host_multiple_hostnames_dns_configuration
21 # "Initial user and login":#initial_user
22 # "Test the installed cluster running a simple workflow":#test_install
23
24 h2(#single_host). Single host install using the provision.sh script
25
26 <b>NOTE: The single host installation is not recommended for production use.</b>
27
28 This is a package-based installation method. The Salt scripts are available from the "tools/salt-install":https://github.com/arvados/arvados/tree/master/tools/salt-install directory in the Arvados git repository.
29
30 This procedure will install all the main Arvados components to get you up and running in a single host. The whole installation procedure takes somewhere between 15 to 60 minutes, depending on the host resources and its network bandwidth. As a reference, on a virtual machine with 1 core and 1 GB RAM, it takes ~25 minutes to do the initial install.
31
32 We suggest you to use the @provision.sh@ script to deploy Arvados, which is implemented with the @arvados-formula@ in a Saltstack master-less setup. After setting up a few variables in a config file (next step), you'll be ready to run it and get Arvados deployed.
33
34 h2(#choose_configuration). Choose the desired configuration
35
36 For documentation's sake, we will use the cluster name <i>arva2</i> and the domain <i>arv.local</i>. If you don't change them as required in the next steps, installation won't proceed.
37
38 Arvados' single host installation can be done in two fashions:
39
40 * Using a single hostname, asigning <i>a different port (other than 443) for each user-facing service</i>: This choice is easier to setup, but the user will need to know the port/s for the different services she wants to connect to.
41 * Using multiple hostnames on the same IP: this setup involves a few extra steps but each service will have a meaningful hostname so it will make easier to access them later.
42
43 Once you decide which of these choices you prefer, copy one the two example configuration files and directory, and edit them to suit your needs.
44
45 h3(#single_host_single_hostnames). Single host / single hostname
46 <notextile>
47 <pre><code>cp local.params.example.single_host_single_hostname local.params
48 cp -r config_examples/single_host/single_hostname local_config_dir
49 </code></pre>
50 </notextile>
51
52 Edit the variables in the <i>local.params</i> file. Pay attention to the <b>*_PORT, *_TOKEN</b> and <b>*KEY</b> variables.
53
54 h3(#single_host_multiple_hostnames). Single host / multiple hostnames (Alternative configuration)
55 <notextile>
56 <pre><code>cp local.params.example.single_host_multiple_hostnames local.params
57 cp -r config_examples/single_host/multiple_hostnames local_config_dir
58 </code></pre>
59 </notextile>
60
61 Edit the variables in the <i>local.params</i> file.
62
63 ## "Further customization of the installation (modifying the salt pillars and states)":#further_customization
64
65 If you want or need further customization, you can edit the Saltstack pillars and states files. Pay particular attention to the <i>pillars/arvados.sls</i> one. Any extra <i>state</i> file you add under <i>local_config_dir/states</i> will be added to the salt run and applied to the host.
66
67 h2(#run_provision_script). Run the provision.sh script
68
69 When you finished customizing the configuration, you are ready to copy the files to the host (if needed) and run the @provision.sh@ script:
70
71 <notextile>
72 <pre><code>scp -r provision.sh local* user@host:
73 ssh user@host sudo provision.sh
74 </code></pre>
75 </notextile>
76
77 and wait for it to finish.
78
79 If everything goes OK, you'll get some final lines stating something like:
80
81 <notextile>
82 <pre><code>arvados: Succeeded: 109 (changed=9)
83 arvados: Failed:      0
84 </code></pre>
85 </notextile>
86
87 h2(#final_steps). Final configuration steps
88
89 Once the deployment went OK, you'll need to perform a few extra steps in your local browser/host to access the cluster.
90
91 h3(#ca_root_certificate). Install the CA root certificate (required in both alternatives)
92
93 Arvados uses SSL to encrypt communications. Its UI uses AJAX which will silently fail if the certificate is not valid or signed by an unknown Certification Authority.
94
95 For this reason, the @arvados-formula@ has a helper state to create a root certificate to authorize Arvados services. The @provision.sh@ script will leave a copy of the generated CA's certificate (@arvados-snakeoil-ca.pem@) in the script's directory so you can add it to your workstation.
96
97 Installing the root certificate into your web browser will prevent security errors when accessing Arvados services with your web browser.
98
99 # Go to the certificate manager in your browser.
100 #* In Chrome, this can be found under "Settings &rarr; Advanced &rarr; Manage Certificates" or by entering @chrome://settings/certificates@ in the URL bar.
101 #* In Firefox, this can be found under "Preferences &rarr; Privacy & Security" or entering @about:preferences#privacy@ in the URL bar and then choosing "View Certificates...".
102 # Select the "Authorities" tab, then press the "Import" button.  Choose @arvados-snakeoil-ca.pem@
103
104 The certificate will be added under the "Arvados Formula".
105
106 To access your Arvados instance using command line clients (such as arv-get and arv-put) without security errors, install the certificate into the OS certificate storage.
107
108 * On Debian/Ubuntu:
109
110 <notextile>
111 <pre><code>cp arvados-root-cert.pem /usr/local/share/ca-certificates/
112 /usr/sbin/update-ca-certificates
113 </code></pre>
114 </notextile>
115
116 * On CentOS:
117
118 <notextile>
119 <pre><code>cp arvados-root-cert.pem /etc/pki/ca-trust/source/anchors/
120 /usr/bin/update-ca-trust
121 </code></pre>
122 </notextile>
123
124 h3(#single_host_multiple_hostnames_dns_configuration). DNS configuration (single host / multiple hostnames)
125
126 When using multiple hostnames, after the setup is done, you need to set up your DNS to be able to access the cluster.
127
128 If you don't have access to the domain's DNS to add the required entries, the simplest way to do it is to edit your @/etc/hosts@ file (as root):
129
130 <notextile>
131 <pre><code>export CLUSTER="arva2"
132 export DOMAIN="arv.local"
133 export HOST_IP="127.0.0.2"    # This is valid either if installing in your computer directly
134                               # or in a Vagrant VM. If you're installing it on a remote host
135                               # just change the IP to match that of the host.
136 echo "${HOST_IP} api keep keep0 collections download ws workbench workbench2 ${CLUSTER}.${DOMAIN} api.${CLUSTER}.${DOMAIN} keep.${CLUSTER}.${DOMAIN} keep0.${CLUSTER}.${DOMAIN} collections.${CLUSTER}.${DOMAIN} download.${CLUSTER}.${DOMAIN} ws.${CLUSTER}.${DOMAIN} workbench.${CLUSTER}.${DOMAIN} workbench2.${CLUSTER}.${DOMAIN}" >> /etc/hosts
137 </code></pre>
138 </notextile>
139
140 h2(#initial_user). Initial user and login 
141
142 At this point you should be able to log into the Arvados cluster. The initial URL will be:
143
144 * https://workbench.arva2.arv.local
145
146 or, in general, the url format will be:
147
148 * https://workbench.@<cluster>.<domain>@
149
150 By default, the provision script creates an initial user for testing purposes. This user is configured as administrator of the newly created cluster.
151
152 Assuming you didn't change these values in the @local.params@ file, the initial credentials are:
153
154 * User: 'admin'
155 * Password: 'password'
156 * Email: 'admin@arva2.arv.local'
157
158 h2(#test_install). Test the installed cluster running a simple workflow
159
160 The @provision.sh@ script saves a simple example test workflow in the @/tmp/cluster_tests@ directory in the node. If you want to run it, just ssh to the node, change to that directory and run:
161
162 <notextile>
163 <pre><code>cd /tmp/cluster_tests
164 ./run-test.sh
165 </code></pre>
166 </notextile>
167
168 It will create a test user (by default, the same one as the admin user), upload a small workflow and run it. If everything goes OK, the output should similar to this (some output was shortened for clarity):
169
170 <notextile>
171 <pre><code>Creating Arvados Standard Docker Images project
172 Arvados project uuid is 'arva2-j7d0g-0prd8cjlk6kfl7y'
173 {
174  ...
175  "uuid":"arva2-o0j2j-n4zu4cak5iifq2a",
176  "owner_uuid":"arva2-tpzed-000000000000000",
177  ...
178 }
179 Uploading arvados/jobs' docker image to the project
180 2.1.1: Pulling from arvados/jobs
181 8559a31e96f4: Pulling fs layer
182 ...
183 Status: Downloaded newer image for arvados/jobs:2.1.1
184 docker.io/arvados/jobs:2.1.1
185 2020-11-23 21:43:39 arvados.arv_put[32678] INFO: Creating new cache file at /home/vagrant/.cache/arvados/arv-put/c59256eda1829281424c80f588c7cc4d
186 2020-11-23 21:43:46 arvados.arv_put[32678] INFO: Collection saved as 'Docker image arvados jobs:2.1.1 sha256:0dd50'
187 arva2-4zz18-1u5pvbld7cvxuy2
188 Creating initial user ('admin')
189 Setting up user ('admin')
190 {
191  "items":[
192   {
193    ...
194    "owner_uuid":"arva2-tpzed-000000000000000",
195    ...
196    "uuid":"arva2-o0j2j-1ownrdne0ok9iox"
197   },
198   {
199    ...
200    "owner_uuid":"arva2-tpzed-000000000000000",
201    ...
202    "uuid":"arva2-o0j2j-1zbeyhcwxc1tvb7"
203   },
204   {
205    ...
206    "email":"admin@arva2.arv.local",
207    ...
208    "owner_uuid":"arva2-tpzed-000000000000000",
209    ...
210    "username":"admin",
211    "uuid":"arva2-tpzed-3wrm93zmzpshrq2",
212    ...
213   }
214  ],
215  "kind":"arvados#HashList"
216 }
217 Activating user 'admin'
218 {
219  ...
220  "email":"admin@arva2.arv.local",
221  ...
222  "username":"admin",
223  "uuid":"arva2-tpzed-3wrm93zmzpshrq2",
224  ...
225 }
226 Running test CWL workflow
227 INFO /usr/bin/cwl-runner 2.1.1, arvados-python-client 2.1.1, cwltool 3.0.20200807132242
228 INFO Resolved 'hasher-workflow.cwl' to 'file:///tmp/cluster_tests/hasher-workflow.cwl'
229 ...
230 INFO Using cluster arva2 (https://arva2.arv.local:8443/)
231 INFO Upload local files: "test.txt"
232 INFO Uploaded to ea34d971b71d5536b4f6b7d6c69dc7f6+50 (arva2-4zz18-c8uvwqdry4r8jao)
233 INFO Using collection cache size 256 MiB
234 INFO [container hasher-workflow.cwl] submitted container_request arva2-xvhdp-v1bkywd58gyocwm
235 INFO [container hasher-workflow.cwl] arva2-xvhdp-v1bkywd58gyocwm is Final
236 INFO Overall process status is success
237 INFO Final output collection d6c69a88147dde9d52a418d50ef788df+123
238 {
239     "hasher_out": {
240         "basename": "hasher3.md5sum.txt",
241         "class": "File",
242         "location": "keep:d6c69a88147dde9d52a418d50ef788df+123/hasher3.md5sum.txt",
243         "size": 95
244     }
245 }
246 INFO Final process status is success
247 </code></pre>
248 </notextile>