15881: Add LDAP authentication option.
[arvados.git] / lib / config / generated_config.go
1 // Copyright (C) The Arvados Authors. All rights reserved.
2 //
3 // SPDX-License-Identifier: AGPL-3.0
4
5 package config
6
7 var DefaultYAML = []byte(`# Copyright (C) The Arvados Authors. All rights reserved.
8 #
9 # SPDX-License-Identifier: AGPL-3.0
10
11 # Do not use this file for site configuration. Create
12 # /etc/arvados/config.yml instead.
13 #
14 # The order of precedence (highest to lowest):
15 # 1. Legacy component-specific config files (deprecated)
16 # 2. /etc/arvados/config.yml
17 # 3. config.default.yml
18
19 Clusters:
20   xxxxx:
21     SystemRootToken: ""
22
23     # Token to be included in all healthcheck requests. Disabled by default.
24     # Server expects request header of the format "Authorization: Bearer xxx"
25     ManagementToken: ""
26
27     Services:
28
29       # In each of the service sections below, the keys under
30       # InternalURLs are the endpoints where the service should be
31       # listening, and reachable from other hosts in the cluster.
32       SAMPLE:
33         InternalURLs:
34           "http://host1.example:12345": {}
35           "http://host2.example:12345":
36             # Rendezvous is normally empty/omitted. When changing the
37             # URL of a Keepstore service, Rendezvous should be set to
38             # the old URL (with trailing slash omitted) to preserve
39             # rendezvous ordering.
40             Rendezvous: ""
41           SAMPLE:
42             Rendezvous: ""
43         ExternalURL: "-"
44
45       RailsAPI:
46         InternalURLs: {}
47         ExternalURL: "-"
48       Controller:
49         InternalURLs: {}
50         ExternalURL: ""
51       Websocket:
52         InternalURLs: {}
53         ExternalURL: ""
54       Keepbalance:
55         InternalURLs: {}
56         ExternalURL: "-"
57       GitHTTP:
58         InternalURLs: {}
59         ExternalURL: ""
60       GitSSH:
61         InternalURLs: {}
62         ExternalURL: ""
63       DispatchCloud:
64         InternalURLs: {}
65         ExternalURL: "-"
66       SSO:
67         InternalURLs: {}
68         ExternalURL: ""
69       Keepproxy:
70         InternalURLs: {}
71         ExternalURL: ""
72       WebDAV:
73         InternalURLs: {}
74         # Base URL for Workbench inline preview.  If blank, use
75         # WebDAVDownload instead, and disable inline preview.
76         # If both are empty, downloading collections from workbench
77         # will be impossible.
78         #
79         # It is important to properly configure the download service
80         # to migitate cross-site-scripting (XSS) attacks.  A HTML page
81         # can be stored in collection.  If an attacker causes a victim
82         # to visit that page through Workbench, it will be rendered by
83         # the browser.  If all collections are served at the same
84         # domain, the browser will consider collections as coming from
85         # the same origin and having access to the same browsing data,
86         # enabling malicious Javascript on that page to access Arvados
87         # on behalf of the victim.
88         #
89         # This is mitigating by having separate domains for each
90         # collection, or limiting preview to circumstances where the
91         # collection is not accessed with the user's regular
92         # full-access token.
93         #
94         # Serve preview links using uuid or pdh in subdomain
95         # (requires wildcard DNS and TLS certificate)
96         #   https://*.collections.uuid_prefix.arvadosapi.com
97         #
98         # Serve preview links using uuid or pdh in main domain
99         # (requires wildcard DNS and TLS certificate)
100         #   https://*--collections.uuid_prefix.arvadosapi.com
101         #
102         # Serve preview links by setting uuid or pdh in the path.
103         # This configuration only allows previews of public data or
104         # collection-sharing links, because these use the anonymous
105         # user token or the token is already embedded in the URL.
106         # Other data must be handled as downloads via WebDAVDownload:
107         #   https://collections.uuid_prefix.arvadosapi.com
108         #
109         ExternalURL: ""
110
111       WebDAVDownload:
112         InternalURLs: {}
113         # Base URL for download links. If blank, serve links to WebDAV
114         # with disposition=attachment query param.  Unlike preview links,
115         # browsers do not render attachments, so there is no risk of XSS.
116         #
117         # If WebDAVDownload is blank, and WebDAV uses a
118         # single-origin form, then Workbench will show an error page
119         #
120         # Serve download links by setting uuid or pdh in the path:
121         #   https://download.uuid_prefix.arvadosapi.com
122         #
123         ExternalURL: ""
124
125       Keepstore:
126         InternalURLs: {}
127         ExternalURL: "-"
128       Composer:
129         InternalURLs: {}
130         ExternalURL: ""
131       WebShell:
132         InternalURLs: {}
133         # ShellInABox service endpoint URL for a given VM.  If empty, do not
134         # offer web shell logins.
135         #
136         # E.g., using a path-based proxy server to forward connections to shell hosts:
137         # https://webshell.uuid_prefix.arvadosapi.com
138         #
139         # E.g., using a name-based proxy server to forward connections to shell hosts:
140         # https://*.webshell.uuid_prefix.arvadosapi.com
141         ExternalURL: ""
142       Workbench1:
143         InternalURLs: {}
144         ExternalURL: ""
145       Workbench2:
146         InternalURLs: {}
147         ExternalURL: ""
148       Nodemanager:
149         InternalURLs: {}
150         ExternalURL: "-"
151       Health:
152         InternalURLs: {}
153         ExternalURL: "-"
154
155     PostgreSQL:
156       # max concurrent connections per arvados server daemon
157       ConnectionPool: 32
158       Connection:
159         # All parameters here are passed to the PG client library in a connection string;
160         # see https://www.postgresql.org/docs/current/static/libpq-connect.html#LIBPQ-PARAMKEYWORDS
161         host: ""
162         port: ""
163         user: ""
164         password: ""
165         dbname: ""
166         SAMPLE: ""
167     API:
168       # Maximum size (in bytes) allowed for a single API request.  This
169       # limit is published in the discovery document for use by clients.
170       # Note: You must separately configure the upstream web server or
171       # proxy to actually enforce the desired maximum request size on the
172       # server side.
173       MaxRequestSize: 134217728
174
175       # Limit the number of bytes read from the database during an index
176       # request (by retrieving and returning fewer rows than would
177       # normally be returned in a single response).
178       # Note 1: This setting never reduces the number of returned rows to
179       # zero, no matter how big the first data row is.
180       # Note 2: Currently, this is only checked against a specific set of
181       # columns that tend to get large (collections.manifest_text,
182       # containers.mounts, workflows.definition). Other fields (e.g.,
183       # "properties" hashes) are not counted against this limit.
184       MaxIndexDatabaseRead: 134217728
185
186       # Maximum number of items to return when responding to a APIs that
187       # can return partial result sets using limit and offset parameters
188       # (e.g., *.index, groups.contents). If a request specifies a "limit"
189       # parameter higher than this value, this value is used instead.
190       MaxItemsPerResponse: 1000
191
192       # Maximum number of concurrent requests to accept in a single
193       # service process, or 0 for no limit.
194       MaxConcurrentRequests: 0
195
196       # Maximum number of 64MiB memory buffers per Keepstore server process, or
197       # 0 for no limit. When this limit is reached, up to
198       # (MaxConcurrentRequests - MaxKeepBlobBuffers) HTTP requests requiring
199       # buffers (like GET and PUT) will wait for buffer space to be released.
200       # Any HTTP requests beyond MaxConcurrentRequests will receive an
201       # immediate 503 response.
202       #
203       # MaxKeepBlobBuffers should be set such that (MaxKeepBlobBuffers * 64MiB
204       # * 1.1) fits comfortably in memory. On a host dedicated to running
205       # Keepstore, divide total memory by 88MiB to suggest a suitable value.
206       # For example, if grep MemTotal /proc/meminfo reports MemTotal: 7125440
207       # kB, compute 7125440 / (88 * 1024)=79 and configure MaxBuffers: 79
208       MaxKeepBlobBuffers: 128
209
210       # API methods to disable. Disabled methods are not listed in the
211       # discovery document, and respond 404 to all requests.
212       # Example: {"jobs.create":{}, "pipeline_instances.create": {}}
213       DisabledAPIs: {}
214
215       # Interval (seconds) between asynchronous permission view updates. Any
216       # permission-updating API called with the 'async' parameter schedules a an
217       # update on the permission view in the future, if not already scheduled.
218       AsyncPermissionsUpdateInterval: 20s
219
220       # Maximum number of concurrent outgoing requests to make while
221       # serving a single incoming multi-cluster (federated) request.
222       MaxRequestAmplification: 4
223
224       # RailsSessionSecretToken is a string of alphanumeric characters
225       # used by Rails to sign session tokens. IMPORTANT: This is a
226       # site secret. It should be at least 50 characters.
227       RailsSessionSecretToken: ""
228
229       # Maximum wall clock time to spend handling an incoming request.
230       RequestTimeout: 5m
231
232       # Websocket will send a periodic empty event after 'SendTimeout'
233       # if there is no other activity to maintain the connection /
234       # detect dropped connections.
235       SendTimeout: 60s
236
237       WebsocketClientEventQueue: 64
238       WebsocketServerEventQueue: 4
239
240       # Timeout on requests to internal Keep services.
241       KeepServiceRequestTimeout: 15s
242
243     Users:
244       # Config parameters to automatically setup new users.  If enabled,
245       # this users will be able to self-activate.  Enable this if you want
246       # to run an open instance where anyone can create an account and use
247       # the system without requiring manual approval.
248       #
249       # The params AutoSetupNewUsersWith* are meaningful only when AutoSetupNewUsers is turned on.
250       # AutoSetupUsernameBlacklist is a list of usernames to be blacklisted for auto setup.
251       AutoSetupNewUsers: false
252       AutoSetupNewUsersWithVmUUID: ""
253       AutoSetupNewUsersWithRepository: false
254       AutoSetupUsernameBlacklist:
255         arvados: {}
256         git: {}
257         gitolite: {}
258         gitolite-admin: {}
259         root: {}
260         syslog: {}
261         SAMPLE: {}
262
263       # When NewUsersAreActive is set to true, new users will be active
264       # immediately.  This skips the "self-activate" step which enforces
265       # user agreements.  Should only be enabled for development.
266       NewUsersAreActive: false
267
268       # The e-mail address of the user you would like to become marked as an admin
269       # user on their first login.
270       # In the default configuration, authentication happens through the Arvados SSO
271       # server, which uses OAuth2 against Google's servers, so in that case this
272       # should be an address associated with a Google account.
273       AutoAdminUserWithEmail: ""
274
275       # If AutoAdminFirstUser is set to true, the first user to log in when no
276       # other admin users exist will automatically become an admin user.
277       AutoAdminFirstUser: false
278
279       # Email address to notify whenever a user creates a profile for the
280       # first time
281       UserProfileNotificationAddress: ""
282       AdminNotifierEmailFrom: arvados@example.com
283       EmailSubjectPrefix: "[ARVADOS] "
284       UserNotifierEmailFrom: arvados@example.com
285       NewUserNotificationRecipients: {}
286       NewInactiveUserNotificationRecipients: {}
287
288       # Set AnonymousUserToken to enable anonymous user access. You can get
289       # the token by running "bundle exec ./script/get_anonymous_user_token.rb"
290       # in the directory where your API server is running.
291       AnonymousUserToken: ""
292
293       # If a new user has an alternate email address (local@domain)
294       # with the domain given here, its local part becomes the new
295       # user's default username. Otherwise, the user's primary email
296       # address is used.
297       PreferDomainForUsername: ""
298
299     AuditLogs:
300       # Time to keep audit logs, in seconds. (An audit log is a row added
301       # to the "logs" table in the PostgreSQL database each time an
302       # Arvados object is created, modified, or deleted.)
303       #
304       # Currently, websocket event notifications rely on audit logs, so
305       # this should not be set lower than 300 (5 minutes).
306       MaxAge: 336h
307
308       # Maximum number of log rows to delete in a single SQL transaction.
309       #
310       # If MaxDeleteBatch is 0, log entries will never be
311       # deleted by Arvados. Cleanup can be done by an external process
312       # without affecting any Arvados system processes, as long as very
313       # recent (<5 minutes old) logs are not deleted.
314       #
315       # 100000 is a reasonable batch size for most sites.
316       MaxDeleteBatch: 0
317
318       # Attributes to suppress in events and audit logs.  Notably,
319       # specifying {"manifest_text": {}} here typically makes the database
320       # smaller and faster.
321       #
322       # Warning: Using any non-empty value here can have undesirable side
323       # effects for any client or component that relies on event logs.
324       # Use at your own risk.
325       UnloggedAttributes: {}
326
327     SystemLogs:
328
329       # Logging threshold: panic, fatal, error, warn, info, debug, or
330       # trace
331       LogLevel: info
332
333       # Logging format: json or text
334       Format: json
335
336       # Maximum characters of (JSON-encoded) query parameters to include
337       # in each request log entry. When params exceed this size, they will
338       # be JSON-encoded, truncated to this size, and logged as
339       # params_truncated.
340       MaxRequestLogParamsSize: 2000
341
342     Collections:
343
344       # Enable access controls for data stored in Keep. This should
345       # always be set to true on a production cluster.
346       BlobSigning: true
347
348       # BlobSigningKey is a string of alphanumeric characters used to
349       # generate permission signatures for Keep locators. It must be
350       # identical to the permission key given to Keep. IMPORTANT: This
351       # is a site secret. It should be at least 50 characters.
352       #
353       # Modifying BlobSigningKey will invalidate all existing
354       # signatures, which can cause programs to fail (e.g., arv-put,
355       # arv-get, and Crunch jobs).  To avoid errors, rotate keys only
356       # when no such processes are running.
357       BlobSigningKey: ""
358
359       # Enable garbage collection of unreferenced blobs in Keep.
360       BlobTrash: true
361
362       # Time to leave unreferenced blobs in "trashed" state before
363       # deleting them, or 0 to skip the "trashed" state entirely and
364       # delete unreferenced blobs.
365       #
366       # If you use any Amazon S3 buckets as storage volumes, this
367       # must be at least 24h to avoid occasional data loss.
368       BlobTrashLifetime: 336h
369
370       # How often to check for (and delete) trashed blocks whose
371       # BlobTrashLifetime has expired.
372       BlobTrashCheckInterval: 24h
373
374       # Maximum number of concurrent "trash blob" and "delete trashed
375       # blob" operations conducted by a single keepstore process. Each
376       # of these can be set to 0 to disable the respective operation.
377       #
378       # If BlobTrashLifetime is zero, "trash" and "delete trash"
379       # happen at once, so only the lower of these two values is used.
380       BlobTrashConcurrency: 4
381       BlobDeleteConcurrency: 4
382
383       # Maximum number of concurrent "create additional replica of
384       # existing blob" operations conducted by a single keepstore
385       # process.
386       BlobReplicateConcurrency: 4
387
388       # Default replication level for collections. This is used when a
389       # collection's replication_desired attribute is nil.
390       DefaultReplication: 2
391
392       # BlobSigningTTL determines the minimum lifetime of transient
393       # data, i.e., blocks that are not referenced by
394       # collections. Unreferenced blocks exist for two reasons:
395       #
396       # 1) A data block must be written to a disk/cloud backend device
397       # before a collection can be created/updated with a reference to
398       # it.
399       #
400       # 2) Deleting or updating a collection can remove the last
401       # remaining reference to a data block.
402       #
403       # If BlobSigningTTL is too short, long-running
404       # processes/containers will fail when they take too long (a)
405       # between writing blocks and writing collections that reference
406       # them, or (b) between reading collections and reading the
407       # referenced blocks.
408       #
409       # If BlobSigningTTL is too long, data will still be stored long
410       # after the referring collections are deleted, and you will
411       # needlessly fill up disks or waste money on cloud storage.
412       #
413       # Modifying BlobSigningTTL invalidates existing signatures; see
414       # BlobSigningKey note above.
415       #
416       # The default is 2 weeks.
417       BlobSigningTTL: 336h
418
419       # When running keep-balance, this is the destination filename for
420       # the list of lost block hashes if there are any, one per line.
421       # Updated automically during each successful run.
422       BlobMissingReport: ""
423
424       # keep-balance operates periodically, i.e.: do a
425       # scan/balance operation, sleep, repeat.
426       #
427       # BalancePeriod determines the interval between start times of
428       # successive scan/balance operations. If a scan/balance operation
429       # takes longer than RunPeriod, the next one will follow it
430       # immediately.
431       #
432       # If SIGUSR1 is received during an idle period between operations,
433       # the next operation will start immediately.
434       BalancePeriod: 10m
435
436       # Limits the number of collections retrieved by keep-balance per
437       # API transaction. If this is zero, page size is
438       # determined by the API server's own page size limits (see
439       # API.MaxItemsPerResponse and API.MaxIndexDatabaseRead).
440       BalanceCollectionBatch: 0
441
442       # The size of keep-balance's internal queue of
443       # collections. Higher values use more memory and improve throughput
444       # by allowing keep-balance to fetch the next page of collections
445       # while the current page is still being processed. If this is zero
446       # or omitted, pages are processed serially.
447       BalanceCollectionBuffers: 1000
448
449       # Default lifetime for ephemeral collections: 2 weeks. This must not
450       # be less than BlobSigningTTL.
451       DefaultTrashLifetime: 336h
452
453       # Interval (seconds) between trash sweeps. During a trash sweep,
454       # collections are marked as trash if their trash_at time has
455       # arrived, and deleted if their delete_at time has arrived.
456       TrashSweepInterval: 60s
457
458       # If true, enable collection versioning.
459       # When a collection's preserve_version field is true or the current version
460       # is older than the amount of seconds defined on PreserveVersionIfIdle,
461       # a snapshot of the collection's previous state is created and linked to
462       # the current collection.
463       CollectionVersioning: false
464
465       #   0s = auto-create a new version on every update.
466       #  -1s = never auto-create new versions.
467       # > 0s = auto-create a new version when older than the specified number of seconds.
468       PreserveVersionIfIdle: -1s
469
470       # If non-empty, allow project and collection names to contain
471       # the "/" character (slash/stroke/solidus), and replace "/" with
472       # the given string in the filesystem hierarchy presented by
473       # WebDAV. Example values are "%2f" and "{slash}". Names that
474       # contain the substitution string itself may result in confusing
475       # behavior, so a value like "_" is not recommended.
476       #
477       # If the default empty value is used, the server will reject
478       # requests to create or rename a collection when the new name
479       # contains "/".
480       #
481       # If the value "/" is used, project and collection names
482       # containing "/" will be allowed, but they will not be
483       # accessible via WebDAV.
484       #
485       # Use of this feature is not recommended, if it can be avoided.
486       ForwardSlashNameSubstitution: ""
487
488       # Managed collection properties. At creation time, if the client didn't
489       # provide the listed keys, they will be automatically populated following
490       # one of the following behaviors:
491       #
492       # * UUID of the user who owns the containing project.
493       #   responsible_person_uuid: {Function: original_owner, Protected: true}
494       #
495       # * Default concrete value.
496       #   foo_bar: {Value: baz, Protected: false}
497       #
498       # If Protected is true, only an admin user can modify its value.
499       ManagedProperties:
500         SAMPLE: {Function: original_owner, Protected: true}
501
502       # In "trust all content" mode, Workbench will redirect download
503       # requests to WebDAV preview link, even in the cases when
504       # WebDAV would have to expose XSS vulnerabilities in order to
505       # handle the redirect (see discussion on Services.WebDAV).
506       #
507       # This setting has no effect in the recommended configuration,
508       # where the WebDAV is configured to have a separate domain for
509       # every collection; in this case XSS protection is provided by
510       # browsers' same-origin policy.
511       #
512       # The default setting (false) is appropriate for a multi-user site.
513       TrustAllContent: false
514
515       # Cache parameters for WebDAV content serving:
516       # * TTL: Maximum time to cache manifests and permission checks.
517       # * UUIDTTL: Maximum time to cache collection state.
518       # * MaxBlockEntries: Maximum number of block cache entries.
519       # * MaxCollectionEntries: Maximum number of collection cache entries.
520       # * MaxCollectionBytes: Approximate memory limit for collection cache.
521       # * MaxPermissionEntries: Maximum number of permission cache entries.
522       # * MaxUUIDEntries: Maximum number of UUID cache entries.
523       WebDAVCache:
524         TTL: 300s
525         UUIDTTL: 5s
526         MaxBlockEntries:      4
527         MaxCollectionEntries: 1000
528         MaxCollectionBytes:   100000000
529         MaxPermissionEntries: 1000
530         MaxUUIDEntries:       1000
531
532     Login:
533       # These settings are provided by your OAuth2 provider (eg
534       # Google) used to perform upstream authentication.
535       ProviderAppID: ""
536       ProviderAppSecret: ""
537
538       # (Experimental) Authenticate with Google, bypassing the
539       # SSO-provider gateway service. Use the Google Cloud console to
540       # enable the People API (APIs and Services > Enable APIs and
541       # services > Google People API > Enable), generate a Client ID
542       # and secret (APIs and Services > Credentials > Create
543       # credentials > OAuth client ID > Web application) and add your
544       # controller's /login URL (e.g.,
545       # "https://zzzzz.example.com/login") as an authorized redirect
546       # URL.
547       #
548       # Incompatible with ForceLegacyAPI14. ProviderAppID must be
549       # blank.
550       GoogleClientID: ""
551       GoogleClientSecret: ""
552
553       # Allow users to log in to existing accounts using any verified
554       # email address listed by their Google account. If true, the
555       # Google People API must be enabled in order for Google login to
556       # work. If false, only the primary email address will be used.
557       GoogleAlternateEmailAddresses: true
558
559       # (Experimental) Use PAM to authenticate logins, using the
560       # specified PAM service name.
561       #
562       # Cannot be used in combination with OAuth2 (ProviderAppID) or
563       # Google (GoogleClientID). Cannot be used on a cluster acting as
564       # a LoginCluster.
565       PAM: false
566       PAMService: arvados
567
568       # Domain name (e.g., "example.com") to use to construct the
569       # user's email address if PAM authentication returns a username
570       # with no "@". If empty, use the PAM username as the user's
571       # email address, whether or not it contains "@".
572       #
573       # Note that the email address is used as the primary key for
574       # user records when logging in. Therefore, if you change
575       # PAMDefaultEmailDomain after the initial installation, you
576       # should also update existing user records to reflect the new
577       # domain. Otherwise, next time those users log in, they will be
578       # given new accounts instead of accessing their existing
579       # accounts.
580       PAMDefaultEmailDomain: ""
581
582       LDAP:
583         # Use an LDAP service to authenticate users.
584         Enable: false
585
586         # Server URL, like "ldap://ldapserver.example.com:389".
587         URL: "ldap://ldap:389"
588
589         # Use StartTLS upon connecting to the server.
590         StartTLS: true
591
592         # Skip TLS certificate name verification.
593         InsecureTLS: false
594
595         # Strip the @domain part if a user supplies an email-style
596         # username with this domain. If "*", strip any user-provided
597         # domain. If "", never strip the domain part. Example:
598         # "example.com"
599         StripDomain: ""
600
601         # If, after applying StripDomain, the username contains no "@"
602         # character, append this domain to form an email-style
603         # username. Example: "example.com"
604         AppendDomain: ""
605
606         # The LDAP attribute to filter on when looking up a username
607         # (after applying StripDomain and AppendDomain).
608         SearchAttribute: uid
609
610         # Bind with this username (DN or UPN) and password when
611         # looking up the user record.
612         #
613         # Example user: "cn=admin,dc=example,dc=com"
614         SearchBindUser: ""
615         SearchBindPassword: ""
616
617         # Directory base for username lookup. Example:
618         # "ou=Users,dc=example,dc=com"
619         SearchBase: ""
620
621         # Additional filters for username lookup. Special characters
622         # in assertion values must be escaped (see RFC4515). Example:
623         # "(objectClass=person)"
624         SearchFilters: ""
625
626         # LDAP attribute to use as the user's email address.
627         #
628         # Important: This must not be an attribute whose value can be
629         # edited in the directory by the users themselves. Otherwise,
630         # users can take over other users' Arvados accounts trivially
631         # (email address is the primary key for Arvados accounts.)
632         EmailAttribute: mail
633
634         # LDAP attribute to use as the preferred Arvados username. If
635         # no value is found (or this config is empty) the username
636         # originally supplied by the user will be used.
637         UsernameAttribute: uid
638
639       # The cluster ID to delegate the user database.  When set,
640       # logins on this cluster will be redirected to the login cluster
641       # (login cluster must appear in RemoteClusters with Proxy: true)
642       LoginCluster: ""
643
644       # How long a cached token belonging to a remote cluster will
645       # remain valid before it needs to be revalidated.
646       RemoteTokenRefresh: 5m
647
648     Git:
649       # Path to git or gitolite-shell executable. Each authenticated
650       # request will execute this program with the single argument "http-backend"
651       GitCommand: /usr/bin/git
652
653       # Path to Gitolite's home directory. If a non-empty path is given,
654       # the CGI environment will be set up to support the use of
655       # gitolite-shell as a GitCommand: for example, if GitoliteHome is
656       # "/gh", then the CGI environment will have GITOLITE_HTTP_HOME=/gh,
657       # PATH=$PATH:/gh/bin, and GL_BYPASS_ACCESS_CHECKS=1.
658       GitoliteHome: ""
659
660       # Git repositories must be readable by api server, or you won't be
661       # able to submit crunch jobs. To pass the test suites, put a clone
662       # of the arvados tree in {git_repositories_dir}/arvados.git or
663       # {git_repositories_dir}/arvados/.git
664       Repositories: /var/lib/arvados/git/repositories
665
666     TLS:
667       Certificate: ""
668       Key: ""
669       Insecure: false
670
671     Containers:
672       # List of supported Docker Registry image formats that compute nodes
673       # are able to use. ` + "`" + `arv keep docker` + "`" + ` will error out if a user tries
674       # to store an image with an unsupported format. Use an empty array
675       # to skip the compatibility check (and display a warning message to
676       # that effect).
677       #
678       # Example for sites running docker < 1.10: {"v1": {}}
679       # Example for sites running docker >= 1.10: {"v2": {}}
680       # Example for disabling check: {}
681       SupportedDockerImageFormats:
682         "v2": {}
683         SAMPLE: {}
684
685       # Include details about job reuse decisions in the server log. This
686       # causes additional database queries to run, so it should not be
687       # enabled unless you expect to examine the resulting logs for
688       # troubleshooting purposes.
689       LogReuseDecisions: false
690
691       # Default value for keep_cache_ram of a container's runtime_constraints.
692       DefaultKeepCacheRAM: 268435456
693
694       # Number of times a container can be unlocked before being
695       # automatically cancelled.
696       MaxDispatchAttempts: 5
697
698       # Default value for container_count_max for container requests.  This is the
699       # number of times Arvados will create a new container to satisfy a container
700       # request.  If a container is cancelled it will retry a new container if
701       # container_count < container_count_max on any container requests associated
702       # with the cancelled container.
703       MaxRetryAttempts: 3
704
705       # The maximum number of compute nodes that can be in use simultaneously
706       # If this limit is reduced, any existing nodes with slot number >= new limit
707       # will not be counted against the new limit. In other words, the new limit
708       # won't be strictly enforced until those nodes with higher slot numbers
709       # go down.
710       MaxComputeVMs: 64
711
712       # Preemptible instance support (e.g. AWS Spot Instances)
713       # When true, child containers will get created with the preemptible
714       # scheduling parameter parameter set.
715       UsePreemptibleInstances: false
716
717       # PEM encoded SSH key (RSA, DSA, or ECDSA) used by the
718       # (experimental) cloud dispatcher for executing containers on
719       # worker VMs. Begins with "-----BEGIN RSA PRIVATE KEY-----\n"
720       # and ends with "\n-----END RSA PRIVATE KEY-----\n".
721       DispatchPrivateKey: ""
722
723       # Maximum time to wait for workers to come up before abandoning
724       # stale locks from a previous dispatch process.
725       StaleLockTimeout: 1m
726
727       # The crunch-run command to manage the container on a node
728       CrunchRunCommand: "crunch-run"
729
730       # Extra arguments to add to crunch-run invocation
731       # Example: ["--cgroup-parent-subsystem=memory"]
732       CrunchRunArgumentsList: []
733
734       # Extra RAM to reserve on the node, in addition to
735       # the amount specified in the container's RuntimeConstraints
736       ReserveExtraRAM: 256MiB
737
738       # Minimum time between two attempts to run the same container
739       MinRetryPeriod: 0s
740
741       Logging:
742         # When you run the db:delete_old_container_logs task, it will find
743         # containers that have been finished for at least this many seconds,
744         # and delete their stdout, stderr, arv-mount, crunch-run, and
745         # crunchstat logs from the logs table.
746         MaxAge: 720h
747
748         # These two settings control how frequently log events are flushed to the
749         # database.  Log lines are buffered until either crunch_log_bytes_per_event
750         # has been reached or crunch_log_seconds_between_events has elapsed since
751         # the last flush.
752         LogBytesPerEvent: 4096
753         LogSecondsBetweenEvents: 5s
754
755         # The sample period for throttling logs.
756         LogThrottlePeriod: 60s
757
758         # Maximum number of bytes that job can log over crunch_log_throttle_period
759         # before being silenced until the end of the period.
760         LogThrottleBytes: 65536
761
762         # Maximum number of lines that job can log over crunch_log_throttle_period
763         # before being silenced until the end of the period.
764         LogThrottleLines: 1024
765
766         # Maximum bytes that may be logged by a single job.  Log bytes that are
767         # silenced by throttling are not counted against this total.
768         LimitLogBytesPerJob: 67108864
769
770         LogPartialLineThrottlePeriod: 5s
771
772         # Container logs are written to Keep and saved in a
773         # collection, which is updated periodically while the
774         # container runs.  This value sets the interval between
775         # collection updates.
776         LogUpdatePeriod: 30m
777
778         # The log collection is also updated when the specified amount of
779         # log data (given in bytes) is produced in less than one update
780         # period.
781         LogUpdateSize: 32MiB
782
783       SLURM:
784         PrioritySpread: 0
785         SbatchArgumentsList: []
786         SbatchEnvironmentVariables:
787           SAMPLE: ""
788         Managed:
789           # Path to dns server configuration directory
790           # (e.g. /etc/unbound.d/conf.d). If false, do not write any config
791           # files or touch restart.txt (see below).
792           DNSServerConfDir: ""
793
794           # Template file for the dns server host snippets. See
795           # unbound.template in this directory for an example. If false, do
796           # not write any config files.
797           DNSServerConfTemplate: ""
798
799           # String to write to {dns_server_conf_dir}/restart.txt (with a
800           # trailing newline) after updating local data. If false, do not
801           # open or write the restart.txt file.
802           DNSServerReloadCommand: ""
803
804           # Command to run after each DNS update. Template variables will be
805           # substituted; see the "unbound" example below. If false, do not run
806           # a command.
807           DNSServerUpdateCommand: ""
808
809           ComputeNodeDomain: ""
810           ComputeNodeNameservers:
811             "192.168.1.1": {}
812             SAMPLE: {}
813
814           # Hostname to assign to a compute node when it sends a "ping" and the
815           # hostname in its Node record is nil.
816           # During bootstrapping, the "ping" script is expected to notice the
817           # hostname given in the ping response, and update its unix hostname
818           # accordingly.
819           # If false, leave the hostname alone (this is appropriate if your compute
820           # nodes' hostnames are already assigned by some other mechanism).
821           #
822           # One way or another, the hostnames of your node records should agree
823           # with your DNS records and your /etc/slurm-llnl/slurm.conf files.
824           #
825           # Example for compute0000, compute0001, ....:
826           # assign_node_hostname: compute%<slot_number>04d
827           # (See http://ruby-doc.org/core-2.2.2/Kernel.html#method-i-format for more.)
828           AssignNodeHostname: "compute%<slot_number>d"
829
830       JobsAPI:
831         # Enable the legacy 'jobs' API (crunch v1).  This value must be a string.
832         #
833         # Note: this only enables read-only access, creating new
834         # legacy jobs and pipelines is not supported.
835         #
836         # 'auto' -- (default) enable the Jobs API only if it has been used before
837         #         (i.e., there are job records in the database)
838         # 'true' -- enable the Jobs API despite lack of existing records.
839         # 'false' -- disable the Jobs API despite presence of existing records.
840         Enable: 'auto'
841
842         # Git repositories must be readable by api server, or you won't be
843         # able to submit crunch jobs. To pass the test suites, put a clone
844         # of the arvados tree in {git_repositories_dir}/arvados.git or
845         # {git_repositories_dir}/arvados/.git
846         GitInternalDir: /var/lib/arvados/internal.git
847
848       CloudVMs:
849         # Enable the cloud scheduler (experimental).
850         Enable: false
851
852         # Name/number of port where workers' SSH services listen.
853         SSHPort: "22"
854
855         # Interval between queue polls.
856         PollInterval: 10s
857
858         # Shell command to execute on each worker to determine whether
859         # the worker is booted and ready to run containers. It should
860         # exit zero if the worker is ready.
861         BootProbeCommand: "docker ps -q"
862
863         # Minimum interval between consecutive probes to a single
864         # worker.
865         ProbeInterval: 10s
866
867         # Maximum probes per second, across all workers in a pool.
868         MaxProbesPerSecond: 10
869
870         # Time before repeating SIGTERM when killing a container.
871         TimeoutSignal: 5s
872
873         # Time to give up on SIGTERM and write off the worker.
874         TimeoutTERM: 2m
875
876         # Maximum create/destroy-instance operations per second (0 =
877         # unlimited).
878         MaxCloudOpsPerSecond: 0
879
880         # Interval between cloud provider syncs/updates ("list all
881         # instances").
882         SyncInterval: 1m
883
884         # Time to leave an idle worker running (in case new containers
885         # appear in the queue that it can run) before shutting it
886         # down.
887         TimeoutIdle: 1m
888
889         # Time to wait for a new worker to boot (i.e., pass
890         # BootProbeCommand) before giving up and shutting it down.
891         TimeoutBooting: 10m
892
893         # Maximum time a worker can stay alive with no successful
894         # probes before being automatically shut down.
895         TimeoutProbe: 10m
896
897         # Time after shutting down a worker to retry the
898         # shutdown/destroy operation.
899         TimeoutShutdown: 10s
900
901         # Worker VM image ID.
902         ImageID: ""
903
904         # An executable file (located on the dispatcher host) to be
905         # copied to cloud instances at runtime and used as the
906         # container runner/supervisor. The default value is the
907         # dispatcher program itself.
908         #
909         # Use the empty string to disable this step: nothing will be
910         # copied, and cloud instances are assumed to have a suitable
911         # version of crunch-run installed.
912         DeployRunnerBinary: "/proc/self/exe"
913
914         # Tags to add on all resources (VMs, NICs, disks) created by
915         # the container dispatcher. (Arvados's own tags --
916         # InstanceType, IdleBehavior, and InstanceSecret -- will also
917         # be added.)
918         ResourceTags:
919           SAMPLE: "tag value"
920
921         # Prefix for predefined tags used by Arvados (InstanceSetID,
922         # InstanceType, InstanceSecret, IdleBehavior). With the
923         # default value "Arvados", tags are "ArvadosInstanceSetID",
924         # "ArvadosInstanceSecret", etc.
925         #
926         # This should only be changed while no cloud resources are in
927         # use and the cloud dispatcher is not running. Otherwise,
928         # VMs/resources that were added using the old tag prefix will
929         # need to be detected and cleaned up manually.
930         TagKeyPrefix: Arvados
931
932         # Cloud driver: "azure" (Microsoft Azure) or "ec2" (Amazon AWS).
933         Driver: ec2
934
935         # Cloud-specific driver parameters.
936         DriverParameters:
937
938           # (ec2) Credentials.
939           AccessKeyID: ""
940           SecretAccessKey: ""
941
942           # (ec2) Instance configuration.
943           SecurityGroupIDs:
944             "SAMPLE": {}
945           SubnetID: ""
946           Region: ""
947           EBSVolumeType: gp2
948           AdminUsername: debian
949
950           # (azure) Credentials.
951           SubscriptionID: ""
952           ClientID: ""
953           ClientSecret: ""
954           TenantID: ""
955
956           # (azure) Instance configuration.
957           CloudEnvironment: AzurePublicCloud
958           ResourceGroup: ""
959           Location: centralus
960           Network: ""
961           Subnet: ""
962           StorageAccount: ""
963           BlobContainer: ""
964           DeleteDanglingResourcesAfter: 20s
965           AdminUsername: arvados
966
967     InstanceTypes:
968
969       # Use the instance type name as the key (in place of "SAMPLE" in
970       # this sample entry).
971       SAMPLE:
972         # Cloud provider's instance type. Defaults to the configured type name.
973         ProviderType: ""
974         VCPUs: 1
975         RAM: 128MiB
976         IncludedScratch: 16GB
977         AddedScratch: 0
978         Price: 0.1
979         Preemptible: false
980
981     Volumes:
982       SAMPLE:
983         # AccessViaHosts specifies which keepstore processes can read
984         # and write data on the volume.
985         #
986         # For a local filesystem, AccessViaHosts has one entry,
987         # indicating which server the filesystem is located on.
988         #
989         # For a network-attached backend accessible by all keepstore
990         # servers, like a cloud storage bucket or an NFS mount,
991         # AccessViaHosts can be empty/omitted.
992         #
993         # Further info/examples:
994         # https://doc.arvados.org/install/configure-fs-storage.html
995         # https://doc.arvados.org/install/configure-s3-object-storage.html
996         # https://doc.arvados.org/install/configure-azure-blob-storage.html
997         AccessViaHosts:
998           SAMPLE:
999             ReadOnly: false
1000           "http://host1.example:25107": {}
1001         ReadOnly: false
1002         Replication: 1
1003         StorageClasses:
1004           default: true
1005           SAMPLE: true
1006         Driver: s3
1007         DriverParameters:
1008           # for s3 driver -- see
1009           # https://doc.arvados.org/install/configure-s3-object-storage.html
1010           IAMRole: aaaaa
1011           AccessKey: aaaaa
1012           SecretKey: aaaaa
1013           Endpoint: ""
1014           Region: us-east-1a
1015           Bucket: aaaaa
1016           LocationConstraint: false
1017           IndexPageSize: 1000
1018           ConnectTimeout: 1m
1019           ReadTimeout: 10m
1020           RaceWindow: 24h
1021
1022           # For S3 driver, potentially unsafe tuning parameter,
1023           # intentionally excluded from main documentation.
1024           #
1025           # Enable deletion (garbage collection) even when the
1026           # configured BlobTrashLifetime is zero.  WARNING: eventual
1027           # consistency may result in race conditions that can cause
1028           # data loss.  Do not enable this unless you understand and
1029           # accept the risk.
1030           UnsafeDelete: false
1031
1032           # for azure driver -- see
1033           # https://doc.arvados.org/install/configure-azure-blob-storage.html
1034           StorageAccountName: aaaaa
1035           StorageAccountKey: aaaaa
1036           StorageBaseURL: core.windows.net
1037           ContainerName: aaaaa
1038           RequestTimeout: 30s
1039           ListBlobsRetryDelay: 10s
1040           ListBlobsMaxAttempts: 10
1041           MaxGetBytes: 0
1042           WriteRaceInterval: 15s
1043           WriteRacePollTime: 1s
1044
1045           # for local directory driver -- see
1046           # https://doc.arvados.org/install/configure-fs-storage.html
1047           Root: /var/lib/arvados/keep-data
1048
1049           # For local directory driver, potentially confusing tuning
1050           # parameter, intentionally excluded from main documentation.
1051           #
1052           # When true, read and write operations (for whole 64MiB
1053           # blocks) on an individual volume will queued and issued
1054           # serially.  When false, read and write operations will be
1055           # issued concurrently.
1056           #
1057           # May possibly improve throughput if you have physical spinning disks
1058           # and experience contention when there are multiple requests
1059           # to the same volume.
1060           #
1061           # Otherwise, when using SSDs, RAID, or a shared network filesystem, you
1062           # should leave this alone.
1063           Serialize: false
1064
1065     Mail:
1066       MailchimpAPIKey: ""
1067       MailchimpListID: ""
1068       SendUserSetupNotificationEmail: true
1069
1070       # Bug/issue report notification to and from addresses
1071       IssueReporterEmailFrom: "arvados@example.com"
1072       IssueReporterEmailTo: "arvados@example.com"
1073       SupportEmailAddress: "arvados@example.com"
1074
1075       # Generic issue email from
1076       EmailFrom: "arvados@example.com"
1077     RemoteClusters:
1078       "*":
1079         Host: ""
1080         Proxy: false
1081         Scheme: https
1082         Insecure: false
1083         ActivateUsers: false
1084       SAMPLE:
1085         # API endpoint host or host:port; default is {id}.arvadosapi.com
1086         Host: sample.arvadosapi.com
1087
1088         # Perform a proxy request when a local client requests an
1089         # object belonging to this remote.
1090         Proxy: false
1091
1092         # Default "https". Can be set to "http" for testing.
1093         Scheme: https
1094
1095         # Disable TLS verify. Can be set to true for testing.
1096         Insecure: false
1097
1098         # When users present tokens issued by this remote cluster, and
1099         # their accounts are active on the remote cluster, activate
1100         # them on this cluster too.
1101         ActivateUsers: false
1102
1103     Workbench:
1104       # Workbench1 configs
1105       Theme: default
1106       ActivationContactLink: mailto:info@arvados.org
1107       ArvadosDocsite: https://doc.arvados.org
1108       ArvadosPublicDataDocURL: https://playground.arvados.org/projects/public
1109       ShowUserAgreementInline: false
1110       SecretKeyBase: ""
1111
1112       # Scratch directory used by the remote repository browsing
1113       # feature. If it doesn't exist, it (and any missing parents) will be
1114       # created using mkdir_p.
1115       RepositoryCache: /var/www/arvados-workbench/current/tmp/git
1116
1117       # Below is a sample setting of user_profile_form_fields config parameter.
1118       # This configuration parameter should be set to either false (to disable) or
1119       # to a map as shown below.
1120       # Configure the map of input fields to be displayed in the profile page
1121       # using the attribute "key" for each of the input fields.
1122       # This sample shows configuration with one required and one optional form fields.
1123       # For each of these input fields:
1124       #   You can specify "Type" as "text" or "select".
1125       #   List the "Options" to be displayed for each of the "select" menu.
1126       #   Set "Required" as "true" for any of these fields to make them required.
1127       # If any of the required fields are missing in the user's profile, the user will be
1128       # redirected to the profile page before they can access any Workbench features.
1129       UserProfileFormFields:
1130         SAMPLE:
1131           Type: select
1132           FormFieldTitle: Best color
1133           FormFieldDescription: your favorite color
1134           Required: false
1135           Position: 1
1136           Options:
1137             red: {}
1138             blue: {}
1139             green: {}
1140             SAMPLE: {}
1141
1142         # exampleTextValue:  # key that will be set in properties
1143         #   Type: text  #
1144         #   FormFieldTitle: ""
1145         #   FormFieldDescription: ""
1146         #   Required: true
1147         #   Position: 1
1148         # exampleOptionsValue:
1149         #   Type: select
1150         #   FormFieldTitle: ""
1151         #   FormFieldDescription: ""
1152         #   Required: true
1153         #   Position: 1
1154         #   Options:
1155         #     red: {}
1156         #     blue: {}
1157         #     yellow: {}
1158
1159       # Use "UserProfileFormMessage to configure the message you want
1160       # to display on the profile page.
1161       UserProfileFormMessage: 'Welcome to Arvados. All <span style="color:red">required fields</span> must be completed before you can proceed.'
1162
1163       # Mimetypes of applications for which the view icon
1164       # would be enabled in a collection's show page.
1165       # It is sufficient to list only applications here.
1166       # No need to list text and image types.
1167       ApplicationMimetypesWithViewIcon:
1168         cwl: {}
1169         fasta: {}
1170         go: {}
1171         javascript: {}
1172         json: {}
1173         pdf: {}
1174         python: {}
1175         x-python: {}
1176         r: {}
1177         rtf: {}
1178         sam: {}
1179         x-sh: {}
1180         vnd.realvnc.bed: {}
1181         xml: {}
1182         xsl: {}
1183         SAMPLE: {}
1184
1185       # The maximum number of bytes to load in the log viewer
1186       LogViewerMaxBytes: 1M
1187
1188       # When anonymous_user_token is configured, show public projects page
1189       EnablePublicProjectsPage: true
1190
1191       # By default, disable the "Getting Started" popup which is specific to Arvados playground
1192       EnableGettingStartedPopup: false
1193
1194       # Ask Arvados API server to compress its response payloads.
1195       APIResponseCompression: true
1196
1197       # Timeouts for API requests.
1198       APIClientConnectTimeout: 2m
1199       APIClientReceiveTimeout: 5m
1200
1201       # Maximum number of historic log records of a running job to fetch
1202       # and display in the Log tab, while subscribing to web sockets.
1203       RunningJobLogRecordsToFetch: 2000
1204
1205       # In systems with many shared projects, loading of dashboard and topnav
1206       # cab be slow due to collections indexing; use the following parameters
1207       # to suppress these properties
1208       ShowRecentCollectionsOnDashboard: true
1209       ShowUserNotifications: true
1210
1211       # Enable/disable "multi-site search" in top nav ("true"/"false"), or
1212       # a link to the multi-site search page on a "home" Workbench site.
1213       #
1214       # Example:
1215       #   https://workbench.qr1hi.arvadosapi.com/collections/multisite
1216       MultiSiteSearch: ""
1217
1218       # Should workbench allow management of local git repositories? Set to false if
1219       # the jobs api is disabled and there are no local git repositories.
1220       Repositories: true
1221
1222       SiteName: Arvados Workbench
1223       ProfilingEnabled: false
1224
1225       # This is related to obsolete Google OpenID 1.0 login
1226       # but some workbench stuff still expects it to be set.
1227       DefaultOpenIdPrefix: "https://www.google.com/accounts/o8/id"
1228
1229       # Workbench2 configs
1230       VocabularyURL: ""
1231       FileViewersConfigURL: ""
1232
1233       # Workbench welcome screen, this is HTML text that will be
1234       # incorporated directly onto the page.
1235       WelcomePageHTML: |
1236         <img src="/arvados-logo-big.png" style="width: 20%; float: right; padding: 1em;" />
1237         <h2>Please log in.</h2>
1238
1239         <p>The "Log in" button below will show you a sign-in
1240         page. After you log in, you will be redirected back to
1241         Arvados Workbench.</p>
1242
1243         <p>If you have never used Arvados Workbench before, logging in
1244         for the first time will automatically create a new
1245         account.</p>
1246
1247         <i>Arvados Workbench uses your name and email address only for
1248         identification, and does not retrieve any other personal
1249         information.</i>
1250
1251       # Workbench screen displayed to inactive users.  This is HTML
1252       # text that will be incorporated directly onto the page.
1253       InactivePageHTML: |
1254         <img src="/arvados-logo-big.png" style="width: 20%; float: right; padding: 1em;" />
1255         <h3>Hi! You're logged in, but...</h3>
1256         <p>Your account is inactive.</p>
1257         <p>An administrator must activate your account before you can get
1258         any further.</p>
1259
1260       # Connecting to Arvados shell VMs tends to be site-specific.
1261       # Put any special instructions here. This is HTML text that will
1262       # be incorporated directly onto the Workbench page.
1263       SSHHelpPageHTML: |
1264         <a href="https://doc.arvados.org/user/getting_started/ssh-access-unix.html">Accessing an Arvados VM with SSH</a> (generic instructions).
1265         Site configurations vary.  Contact your local cluster administrator if you have difficulty accessing an Arvados shell node.
1266
1267       # Sample text if you are using a "switchyard" ssh proxy.
1268       # Replace "zzzzz" with your Cluster ID.
1269       #SSHHelpPageHTML: |
1270       # <p>Add a section like this to your SSH configuration file ( <i>~/.ssh/config</i>):</p>
1271       # <pre>Host *.zzzzz
1272       #  TCPKeepAlive yes
1273       #  ServerAliveInterval 60
1274       #  ProxyCommand ssh -p2222 turnout@switchyard.zzzzz.arvadosapi.com -x -a $SSH_PROXY_FLAGS %h
1275       # </pre>
1276
1277       # If you are using a switchyard ssh proxy, shell node hostnames
1278       # may require a special hostname suffix.  In the sample ssh
1279       # configuration above, this would be ".zzzzz"
1280       # This is added to the hostname in the "command line" column
1281       # the Workbench "shell VMs" page.
1282       #
1283       # If your shell nodes are directly accessible by users without a
1284       # proxy and have fully qualified host names, you should leave
1285       # this blank.
1286       SSHHelpHostSuffix: ""
1287
1288     # Bypass new (Arvados 1.5) API implementations, and hand off
1289     # requests directly to Rails instead. This can provide a temporary
1290     # workaround for clients that are incompatible with the new API
1291     # implementation. Note that it also disables some new federation
1292     # features and will be removed in a future release.
1293     ForceLegacyAPI14: false
1294
1295 # (Experimental) Restart services automatically when config file
1296 # changes are detected. Only supported by ` + "`" + `arvados-server boot` + "`" + ` in
1297 # dev/test mode.
1298 AutoReloadConfig: false
1299 `)