17742: update docs addressing review suggestions
[arvados.git] / doc / install / salt-single-host.html.textile.liquid
1 ---
2 layout: default
3 navsection: installguide
4 title: Single host Arvados
5 ...
6 {% comment %}
7 Copyright (C) The Arvados Authors. All rights reserved.
8
9 SPDX-License-Identifier: CC-BY-SA-3.0
10 {% endcomment %}
11
12 # "Single host install using the provision.sh script":#single_host
13 # "Choose the desired configuration":#choose_configuration
14 ## "Single host / single hostname":#single_host_single_hostnames
15 ## "Single host / multiple hostnames (Alternative configuration)":#single_host_multiple_hostnames
16 ## "Further customization of the installation (modifying the salt pillars and states)":#further_customization
17 # "Run the provision.sh script":#run_provision_script
18 # "Final configuration steps":#final_steps
19 ## "Install the CA root certificate (required in both alternatives)":#ca_root_certificate
20 ## "DNS configuration (single host / multiple hostnames)":#single_host_multiple_hostnames_dns_configuration
21 # "Initial user and login":#initial_user
22 # "Test the installed cluster running a simple workflow":#test_install
23
24 h2(#single_host). Single host install using the provision.sh script
25
26 <b>NOTE: The single host installation is not recommended for production use.</b>
27
28 {% include 'branchname' %}
29
30 This is a package-based installation method. Start with the @provision.sh@ script which is available by cloning the @{{ branchname }}@ branch from "https://git.arvados.org/arvados.git":https://git.arvados.org/arvados.git .  The @provision.sh@ script and its supporting files can be found in the "arvados/tools/salt-install":https://git.arvados.org/arvados.git/tree/refs/heads/{{ branchname }}:/tools/salt-install directory in the Arvados git repository.
31
32 This procedure will install all the main Arvados components to get you up and running in a single host. The whole installation procedure takes somewhere between 15 to 60 minutes, depending on the host resources and its network bandwidth. As a reference, on a virtual machine with 1 core and 1 GB RAM, it takes ~25 minutes to do the initial install.
33
34 The @provision.sh@ script will help you deploy Arvados by preparing your environment to be able to run the installer, then running it. The actual installer is located at "arvados-formula":https://git.arvados.org/arvados-formula.git/tree/refs/heads/{{ branchname }} and will be cloned during the running of the @provision.sh@ script.  The installer is built using "Saltstack":https://saltproject.io/ and @provision.sh@ performs the install using master-less mode.
35
36 After setting up a few variables in a config file (next step), you'll be ready to run it and get Arvados deployed.
37
38 h2(#choose_configuration). Choose the desired configuration
39
40 For documentation's sake, we will use the cluster name <i>arva2</i> and the domain <i>arv.local</i>. If you don't change them as required in the next steps, installation won't proceed.
41
42 Arvados' single host installation can be done in two fashions:
43
44 * Using a single hostname, assigning <i>a different port (other than 443) for each user-facing service</i>: This choice is easier to setup, but the user will need to know the port/s for the different services she wants to connect to.
45 * Using multiple hostnames on the same IP: this setup involves a few extra steps but each service will have a meaningful hostname so it will make easier to access them later.
46
47 Once you decide which of these choices you prefer, copy one the two example configuration files and directory, and edit them to suit your needs.
48
49 h3(#single_host_single_hostnames). Single host / single hostname
50 <notextile>
51 <pre><code>cp local.params.example.single_host_single_hostname local.params
52 cp -r config_examples/single_host/single_hostname local_config_dir
53 </code></pre>
54 </notextile>
55
56 Edit the variables in the <i>local.params</i> file. Pay attention to the <b>*_PORT, *_TOKEN</b> and <b>*KEY</b> variables.
57
58 The <i>single_host</i> examples use self-signed SSL certificates, which are deployed using the same mechanism used to deploy custom certificates.
59
60 If you plan to use custom certificates, please set the variable <i>USE_LETSENCRYPT=no</i> and copy your certificates to the directory specified with the variable @CUSTOM_CERTS_DIR@ (usually "./certs") in the remote directory where you copied the @provision.sh@ script. From this dir, the provision script will install the certificates required for the role you're installing.
61
62 The script expects cert/key files with these basenames (matching the role except for <i>keepweb</i>, which is split in both <i>download / collections</i>):
63
64 * "controller"
65 * "websocket"
66 * "workbench"
67 * "workbench2"
68 * "webshell"
69 * "download"         # Part of keepweb
70 * "collections"      # Part of keepweb
71 * "keepproxy"
72
73 Ie., for 'keepproxy', the script will lookup for
74
75 <notextile>
76 <pre><code>${CUSTOM_CERTS_DIR}/keepproxy.crt
77 ${CUSTOM_CERTS_DIR}/keepproxy.key
78 </code></pre>
79 </notextile>
80
81 If you want to use valid certificates provided by LetsEncrypt, please set the variable <i>USE_LETSENCRYPT=yes</i> and make sure that all the FQDNs that you will use for the public-facing applications (API/controller, Workbench, Keepproxy/Keepweb) are reachable.
82
83 h3(#single_host_multiple_hostnames). Single host / multiple hostnames (Alternative configuration)
84 <notextile>
85 <pre><code>cp local.params.example.single_host_multiple_hostnames local.params
86 cp -r config_examples/single_host/multiple_hostnames local_config_dir
87 </code></pre>
88 </notextile>
89
90 Edit the variables in the <i>local.params</i> file.
91
92 h3(#further_customization). Further customization of the installation (modifying the salt pillars and states)
93
94 If you want or need further customization, you can edit the Saltstack pillars and states files. Pay particular attention to the <i>pillars/arvados.sls</i> one. Any extra <i>state</i> file you add under <i>local_config_dir/states</i> will be added to the salt run and applied to the host.
95
96 h2(#run_provision_script). Run the provision.sh script
97
98 When you finished customizing the configuration, you are ready to copy the files to the host (if needed) and run the @provision.sh@ script:
99
100 <notextile>
101 <pre><code>scp -r provision.sh local* tests user@host:
102 ssh user@host sudo ./provision.sh
103 </code></pre>
104 </notextile>
105
106 or, if you saved the @local.params@ in another directory or with some other name
107
108 <notextile>
109 <pre><code>scp -r provision.sh local* tests user@host:
110 ssh user@host sudo ./provision.sh -c /path/to/your/local.params.file
111 </code></pre>
112 </notextile>
113
114 and wait for it to finish.
115
116 If everything goes OK, you'll get some final lines stating something like:
117
118 <notextile>
119 <pre><code>arvados: Succeeded: 109 (changed=9)
120 arvados: Failed:      0
121 </code></pre>
122 </notextile>
123
124 h2(#final_steps). Final configuration steps
125
126 Once the deployment went OK, you'll need to perform a few extra steps in your local browser/host to access the cluster.
127
128 h3(#ca_root_certificate). Install the CA root certificate (required in both alternatives)
129
130 Arvados uses SSL to encrypt communications. Its UI uses AJAX which will silently fail if the certificate is not valid or signed by an unknown Certification Authority.
131
132 For this reason, the @arvados-formula@ has a helper state to create a root certificate to authorize Arvados services. The @provision.sh@ script will leave a copy of the generated CA's certificate (@arvados-snakeoil-ca.pem@) in the script's directory so you can add it to your workstation.
133
134 Installing the root certificate into your web browser will prevent security errors when accessing Arvados services with your web browser.
135
136 # Go to the certificate manager in your browser.
137 #* In Chrome, this can be found under "Settings &rarr; Advanced &rarr; Manage Certificates" or by entering @chrome://settings/certificates@ in the URL bar.
138 #* In Firefox, this can be found under "Preferences &rarr; Privacy & Security" or entering @about:preferences#privacy@ in the URL bar and then choosing "View Certificates...".
139 # Select the "Authorities" tab, then press the "Import" button.  Choose @arvados-snakeoil-ca.pem@
140
141 The certificate will be added under the "Arvados Formula".
142
143 To access your Arvados instance using command line clients (such as arv-get and arv-put) without security errors, install the certificate into the OS certificate storage.
144
145 * On Debian/Ubuntu:
146
147 <notextile>
148 <pre><code>cp arvados-root-cert.pem /usr/local/share/ca-certificates/
149 /usr/sbin/update-ca-certificates
150 </code></pre>
151 </notextile>
152
153 * On CentOS:
154
155 <notextile>
156 <pre><code>cp arvados-root-cert.pem /etc/pki/ca-trust/source/anchors/
157 /usr/bin/update-ca-trust
158 </code></pre>
159 </notextile>
160
161 h3(#single_host_multiple_hostnames_dns_configuration). DNS configuration (single host / multiple hostnames)
162
163 When using multiple hostnames, after the setup is done, you need to set up your DNS to be able to access the cluster.
164
165 If you don't have access to the domain's DNS to add the required entries, the simplest way to do it is to edit your @/etc/hosts@ file (as root):
166
167 <notextile>
168 <pre><code>export CLUSTER="arva2"
169 export DOMAIN="arv.local"
170 export HOST_IP="127.0.0.2"    # This is valid either if installing in your computer directly
171                               # or in a Vagrant VM. If you're installing it on a remote host
172                               # just change the IP to match that of the host.
173 echo "${HOST_IP} api keep keep0 collections download ws workbench workbench2 ${CLUSTER}.${DOMAIN} api.${CLUSTER}.${DOMAIN} keep.${CLUSTER}.${DOMAIN} keep0.${CLUSTER}.${DOMAIN} collections.${CLUSTER}.${DOMAIN} download.${CLUSTER}.${DOMAIN} ws.${CLUSTER}.${DOMAIN} workbench.${CLUSTER}.${DOMAIN} workbench2.${CLUSTER}.${DOMAIN}" >> /etc/hosts
174 </code></pre>
175 </notextile>
176
177 h2(#initial_user). Initial user and login
178
179 At this point you should be able to log into the Arvados cluster. The initial URL will be:
180
181 * https://workbench.arva2.arv.local
182
183 or, in general, the url format will be:
184
185 * https://workbench.@<cluster>.<domain>@
186
187 By default, the provision script creates an initial user for testing purposes. This user is configured as administrator of the newly created cluster.
188
189 Assuming you didn't change these values in the @local.params@ file, the initial credentials are:
190
191 * User: 'admin'
192 * Password: 'password'
193 * Email: 'admin@arva2.arv.local'
194
195 h2(#test_install). Test the installed cluster running a simple workflow
196
197 The @provision.sh@ script saves a simple example test workflow in the @/tmp/cluster_tests@ directory in the node. If you want to run it, just ssh to the node, change to that directory and run:
198
199 <notextile>
200 <pre><code>cd /tmp/cluster_tests
201 sudo ./run-test.sh
202 </code></pre>
203 </notextile>
204
205 It will create a test user (by default, the same one as the admin user), upload a small workflow and run it. If everything goes OK, the output should similar to this (some output was shortened for clarity):
206
207 <notextile>
208 <pre><code>Creating Arvados Standard Docker Images project
209 Arvados project uuid is 'arva2-j7d0g-0prd8cjlk6kfl7y'
210 {
211  ...
212  "uuid":"arva2-o0j2j-n4zu4cak5iifq2a",
213  "owner_uuid":"arva2-tpzed-000000000000000",
214  ...
215 }
216 Uploading arvados/jobs' docker image to the project
217 2.1.1: Pulling from arvados/jobs
218 8559a31e96f4: Pulling fs layer
219 ...
220 Status: Downloaded newer image for arvados/jobs:2.1.1
221 docker.io/arvados/jobs:2.1.1
222 2020-11-23 21:43:39 arvados.arv_put[32678] INFO: Creating new cache file at /home/vagrant/.cache/arvados/arv-put/c59256eda1829281424c80f588c7cc4d
223 2020-11-23 21:43:46 arvados.arv_put[32678] INFO: Collection saved as 'Docker image arvados jobs:2.1.1 sha256:0dd50'
224 arva2-4zz18-1u5pvbld7cvxuy2
225 Creating initial user ('admin')
226 Setting up user ('admin')
227 {
228  "items":[
229   {
230    ...
231    "owner_uuid":"arva2-tpzed-000000000000000",
232    ...
233    "uuid":"arva2-o0j2j-1ownrdne0ok9iox"
234   },
235   {
236    ...
237    "owner_uuid":"arva2-tpzed-000000000000000",
238    ...
239    "uuid":"arva2-o0j2j-1zbeyhcwxc1tvb7"
240   },
241   {
242    ...
243    "email":"admin@arva2.arv.local",
244    ...
245    "owner_uuid":"arva2-tpzed-000000000000000",
246    ...
247    "username":"admin",
248    "uuid":"arva2-tpzed-3wrm93zmzpshrq2",
249    ...
250   }
251  ],
252  "kind":"arvados#HashList"
253 }
254 Activating user 'admin'
255 {
256  ...
257  "email":"admin@arva2.arv.local",
258  ...
259  "username":"admin",
260  "uuid":"arva2-tpzed-3wrm93zmzpshrq2",
261  ...
262 }
263 Running test CWL workflow
264 INFO /usr/bin/cwl-runner 2.1.1, arvados-python-client 2.1.1, cwltool 3.0.20200807132242
265 INFO Resolved 'hasher-workflow.cwl' to 'file:///tmp/cluster_tests/hasher-workflow.cwl'
266 ...
267 INFO Using cluster arva2 (https://arva2.arv.local:8443/)
268 INFO Upload local files: "test.txt"
269 INFO Uploaded to ea34d971b71d5536b4f6b7d6c69dc7f6+50 (arva2-4zz18-c8uvwqdry4r8jao)
270 INFO Using collection cache size 256 MiB
271 INFO [container hasher-workflow.cwl] submitted container_request arva2-xvhdp-v1bkywd58gyocwm
272 INFO [container hasher-workflow.cwl] arva2-xvhdp-v1bkywd58gyocwm is Final
273 INFO Overall process status is success
274 INFO Final output collection d6c69a88147dde9d52a418d50ef788df+123
275 {
276     "hasher_out": {
277         "basename": "hasher3.md5sum.txt",
278         "class": "File",
279         "location": "keep:d6c69a88147dde9d52a418d50ef788df+123/hasher3.md5sum.txt",
280         "size": 95
281     }
282 }
283 INFO Final process status is success
284 </code></pre>
285 </notextile>