Merge branch '17779-request-id-in-exception'
[arvados.git] / doc / install / install-manual-prerequisites.html.textile.liquid
1 ---
2 layout: default
3 navsection: installguide
4 title: Planning and prerequisites
5 ...
6 {% comment %}
7 Copyright (C) The Arvados Authors. All rights reserved.
8
9 SPDX-License-Identifier: CC-BY-SA-3.0
10 {% endcomment %}
11
12 Before attempting installation, you should begin by reviewing supported platforms, choosing backends for identity, storage, and scheduling, and decide how you will distribute Arvados services onto machines.  You should also choose an Arvados Cluster ID, choose your hostnames, and aquire TLS certificates.  It may be helpful to make notes as you go along using one of these worksheets:  "New cluster checklist for AWS":new_cluster_checklist_AWS.xlsx - "New cluster checklist for Azure":new_cluster_checklist_Azure.xlsx - "New cluster checklist for on premises Slurm":new_cluster_checklist_slurm.xlsx
13
14 The installation guide describes how to set up a basic standalone Arvados instance.  Additional configuration for features including "federation,":{{site.baseurl}}/admin/federation.html "collection versioning,":{{site.baseurl}}/admin/collection-versioning.html "managed properties,":{{site.baseurl}}/admin/collection-managed-properties.html and "storage classes":{{site.baseurl}}/admin/collection-managed-properties.html are described in the "Admin guide.":{{site.baseurl}}/admin
15
16 The Arvados storage subsystem is called "keep".  The compute subsystem is called "crunch".
17
18 # "Supported GNU/Linux distributions":#supportedlinux
19 # "Choosing which components to install":#components
20 # "Identity provider":#identity
21 # "Storage backend (Keep)":#storage
22 # "Container compute scheduler (Crunch)":#scheduler
23 # "Hardware or virtual machines":#machines
24 # "Arvados Cluster ID":#clusterid
25 # "DNS and TLS":#dnstls
26
27 h2(#supportedlinux). Supported GNU/Linux distributions
28
29 table(table table-bordered table-condensed).
30 |_. Distribution|_. State|_. Last supported version|
31 |CentOS 7|Supported|Latest|
32 |Debian 11 ("bullseye")|Supported|Latest|
33 |Debian 10 ("buster")|Supported|Latest|
34 |Ubuntu 20.04 ("focal")|Supported|Latest|
35 |Ubuntu 18.04 ("bionic")|Supported|Latest|
36 |Ubuntu 16.04 ("xenial")|EOL|2.1.2|
37 |Debian 9 ("stretch")|EOL|2.1.2|
38 |Debian 8 ("jessie")|EOL|1.4.3|
39 |Ubuntu 14.04 ("trusty")|EOL|1.4.3|
40 |Ubuntu 12.04 ("precise")|EOL|8ed7b6dd5d4df93a3f37096afe6d6f81c2a7ef6e (2017-05-03)|
41 |Debian 7 ("wheezy")|EOL|997479d1408139e96ecdb42a60b4f727f814f6c9 (2016-12-28)|
42 |CentOS 6 |EOL|997479d1408139e96ecdb42a60b4f727f814f6c9 (2016-12-28)|
43
44 Arvados packages are published for current Debian releases (until the EOL date), current Ubuntu LTS releases (until the end of standard support), and the latest version of CentOS.
45
46 h2(#components). Choosing which components to install
47
48 Arvados consists of many components, some of which may be omitted (at the cost of reduced functionality.)  It may also be helpful to review the "Arvados Architecture":{{site.baseurl}}/architecture to understand how these components interact.
49
50 table(table table-bordered table-condensed).
51 |\3=. *Core*|
52 |"PostgreSQL database":install-postgresql.html |Stores data for the API server.|Required.|
53 |"API server":install-api-server.html |Core Arvados logic for managing users, groups, collections, containers, and enforcing permissions.|Required.|
54 |\3=. *Keep (storage)*|
55 |"Keepstore":install-keepstore.html |Stores content-addressed blocks in a variety of backends (local filesystem, cloud object storage).|Required.|
56 |"Keepproxy":install-keepproxy.html |Gateway service to access keep servers from external networks.|Required to be able to use arv-put, arv-get, or arv-mount outside the private Arvados network.|
57 |"Keep-web":install-keep-web.html |Gateway service providing read/write HTTP and WebDAV support on top of Keep.|Required to access files from Workbench.|
58 |"Keep-balance":install-keep-balance.html |Storage cluster maintenance daemon responsible for moving blocks to their optimal server location, adjusting block replication levels, and trashing unreferenced blocks.|Required to free deleted data from underlying storage, and to ensure proper replication and block distribution (including support for storage classes).|
59 |\3=. *User interface*|
60 |"Workbench":install-workbench-app.html, "Workbench2":install-workbench2-app.html |Primary graphical user interface for working with file collections and running containers.|Optional.  Depends on API server, keep-web, websockets server.|
61 |"Workflow Composer":install-composer.html |Graphical user interface for editing Common Workflow Language workflows.|Optional.  Depends on git server (arv-git-httpd).|
62 |\3=. *Additional services*|
63 |"Websockets server":install-ws.html |Event distribution server.|Required to view streaming container logs in Workbench.|
64 |"Shell server":install-shell-server.html |Synchronize (create/delete/configure) Unix shell accounts with Arvados users.|Optional.|
65 |"Git server":install-arv-git-httpd.html |Arvados-hosted git repositories, with Arvados-token based authentication.|Optional, but required by Workflow Composer.|
66 |\3=. *Crunch (running containers)*|
67 |"arvados-dispatch-cloud":crunch2-cloud/install-dispatch-cloud.html |Allocate and free cloud VM instances on demand based on workload.|Optional, not needed for a static Slurm cluster such as on-premises HPC.|
68 |"crunch-dispatch-slurm":crunch2-slurm/install-dispatch.html |Run analysis workflows using Docker containers distributed across a Slurm cluster.|Optional, not needed for a Cloud installation, or if you wish to use Arvados for data management only.|
69
70 h2(#identity). Identity provider
71
72 Choose which backend you will use to authenticate users.
73
74 * Google login to authenticate users with a Google account.
75 * OpenID Connect (OIDC) if you have Single-Sign-On (SSO) service that supports the OpenID Connect standard.
76 * LDAP login to authenticate users by username/password using the LDAP protocol, supported by many services such as OpenLDAP and Active Directory.
77 * PAM login to authenticate users by username/password according to the PAM configuration on the controller node.
78
79 h2(#postgresql). PostgreSQL
80
81 Arvados works well with a standalone PostgreSQL installation. When deploying on AWS, Aurora RDS also works but Aurora Serverless is not recommended.
82
83 h2(#storage). Storage backend
84
85 Choose which backend you will use for storing and retrieving content-addressed Keep blocks.
86
87 * File systems storage, such as ext4 or xfs, or network file systems such as GPFS or Lustre
88 * Amazon S3, or other object storage that supports the S3 API including Google Cloud Storage and Ceph.
89 * Azure blob storage
90
91 You should also determine the desired replication factor for your data.  A replication factor of 1 means only a single copy of a given data block is kept.  With a conventional file system backend and a replication factor of 1, a hard drive failure is likely to lose data.  For this reason the default replication factor is 2 (two copies are kept).
92
93 A backend may have its own replication factor (such as durability guarantees of cloud buckets) and Arvados will take this into account when writing a new data block.
94
95 h2(#scheduler). Container compute scheduler
96
97 Choose which backend you will use to schedule computation.
98
99 * On AWS EC2 and Azure, you probably want to use @arvados-dispatch-cloud@ to manage the full lifecycle of cloud compute nodes: starting up nodes sized to the container request, executing containers on those nodes, and shutting nodes down when no longer needed.
100 * For on-premise HPC clusters using "slurm":https://slurm.schedmd.com/ use @crunch-dispatch-slurm@ to execute containers with slurm job submissions.
101 * For single node demos, use @crunch-dispatch-local@ to execute containers directly.
102
103 h2(#machines). Hardware (or virtual machines)
104
105 Choose how to allocate Arvados services to machines.  We recommend that each machine start with a clean installation of a supported GNU/Linux distribution.
106
107 For a production installation, this is a reasonable starting point:
108
109 <div class="offset1">
110 table(table table-bordered table-condensed).
111 |_. Function|_. Number of nodes|_. Recommended specs|
112 |PostgreSQL database, Arvados API server, Arvados controller, Git, Websockets, Container dispatcher|1|16+ GiB RAM, 4+ cores, fast disk for database|
113 |Workbench, Keepproxy, Keep-web, Keep-balance|1|8 GiB RAM, 2+ cores|
114 |Keepstore servers ^1^|2+|4 GiB RAM|
115 |Compute worker nodes ^1^|0+ |Depends on workload; scaled dynamically in the cloud|
116 |User shell nodes ^2^|0+|Depends on workload|
117 </div>
118
119 ^1^ Should be scaled up as needed
120 ^2^ Refers to shell nodes managed by Arvados, that provide ssh access for users to interact with Arvados at the command line.  Optional.
121
122 {% include 'notebox_begin' %}
123 For a small demo installation, it is possible to run all the Arvados services on a single node.  Special considerations for single-node installs will be noted in boxes like this.
124 {% include 'notebox_end' %}
125
126 h2(#clusterid). Arvados Cluster ID
127
128 Each Arvados installation is identified by a cluster identifier, which is a unique 5-character lowercase alphanumeric string. There are 36 5 = 60466176 possible cluster identifiers.
129
130 * For automated test purposes, use “z****”
131 * For experimental/local-only/private clusters that won’t ever be visible on the public Internet, use “x****”
132 * For long-lived clusters, we recommend reserving a cluster id.  Contact "info@curii.com":mailto:info@curii.com for more information.
133
134 Here is one way to make a random 5-character string:
135
136 <notextile>
137 <pre><code>~$ <span class="userinput">tr -dc 0-9a-z &lt;/dev/urandom | head -c5; echo</span>
138 </code></pre>
139 </notextile>
140
141 You may also use a different method to pick the cluster identifier. The cluster identifier will be part of the hostname of the services in your Arvados cluster. The rest of this documentation will refer to it as your @ClusterID@.  Whenever @ClusterID@ appears in a configuration example, replace it with your five-character cluster identifier.
142
143 h2(#dnstls). DNS entries and TLS certificates
144
145 The following services are normally public-facing and require DNS entries and corresponding TLS certificates.  Get certificates from your preferred TLS certificate provider.  We recommend using "Let's Encrypt":https://letsencrypt.org/.  You can run several services on the same node, but each distinct DNS name requires a valid, matching TLS certificate.
146
147 This guide uses the following DNS name conventions.  A later part of this guide will describe how to set up Nginx virtual hosts.
148
149 <div class="offset1">
150 table(table table-bordered table-condensed).
151 |_. Function|_. DNS name|
152 |Arvados API|@ClusterID.example.com@|
153 |Arvados Git server|git.@ClusterID.example.com@|
154 |Arvados Webshell|webshell.@ClusterID.example.com@|
155 |Arvados Websockets endpoint|ws.@ClusterID.example.com@|
156 |Arvados Workbench|workbench.@ClusterID.example.com@|
157 |Arvados Workbench 2|workbench2.@ClusterID.example.com@|
158 |Arvados Keepproxy server|keep.@ClusterID.example.com@|
159 |Arvados Keep-web server|download.@ClusterID.example.com@
160 _and_
161 *.collections.@ClusterID.example.com@ _or_
162 *<notextile>--</notextile>collections.@ClusterID.example.com@ _or_
163 collections.@ClusterID.example.com@ (see the "keep-web install docs":install-keep-web.html)|
164 </div>
165
166 Setting up Arvados is easiest when Wildcard TLS and wildcard DNS are available. It is also possible to set up Arvados without wildcard TLS and DNS, but not having a wildcard for @keep-web@ (i.e. not having *.collections.@ClusterID.example.com@) comes with a tradeoff: it will disable some features that allow users to view Arvados-hosted data in their browsers. More information on this tradeoff caused by the CORS rules applied by modern browsers is available in the "keep-web URL pattern guide":../api/keep-web-urls.html.
167
168 The table below lists the required TLS certificates and DNS names in each scenario.
169
170 <div class="offset1">
171 table(table table-bordered table-condensed).
172 ||_. Wildcard TLS and DNS available|_. Wildcard TLS available|_. Other|
173 |TLS|*.@ClusterID.example.com@
174 @ClusterID.example.com@
175 *.collections.@ClusterID.example.com@|*.@ClusterID.example.com@
176 @ClusterID.example.com@|@ClusterID.example.com@
177 git.@ClusterID.example.com@
178 webshell.@ClusterID.example.com@
179 ws.@ClusterID.example.com@
180 workbench.@ClusterID.example.com@
181 workbench2.@ClusterID.example.com@
182 keep.@ClusterID.example.com@
183 download.@ClusterID.example.com@
184 collections.@ClusterID.example.com@|
185 |DNS|@ClusterID.example.com@
186 git.@ClusterID.example.com@
187 webshell.@ClusterID.example.com@
188 ws.@ClusterID.example.com@
189 workbench.@ClusterID.example.com@
190 workbench2.@ClusterID.example.com@
191 keep.@ClusterID.example.com@
192 download.@ClusterID.example.com@
193 *.collections.@ClusterID.example.com@|@ClusterID.example.com@
194 git.@ClusterID.example.com@
195 webshell.@ClusterID.example.com@
196 ws.@ClusterID.example.com@
197 workbench.@ClusterID.example.com@
198 workbench2.@ClusterID.example.com@
199 keep.@ClusterID.example.com@
200 download.@ClusterID.example.com@
201 collections.@ClusterID.example.com@|@ClusterID.example.com@
202 git.@ClusterID.example.com@
203 webshell.@ClusterID.example.com@
204 ws.@ClusterID.example.com@
205 workbench.@ClusterID.example.com@
206 workbench2.@ClusterID.example.com@
207 keep.@ClusterID.example.com@
208 download.@ClusterID.example.com@
209 collections.@ClusterID.example.com@|
210 </div>
211
212 {% include 'notebox_begin' %}
213 It is also possible to create your own certificate authority, issue server certificates, and install a custom root certificate in the browser.  This is out of scope for this guide.
214 {% include 'notebox_end' %}