Fix multiple exception catching in arv-run.
[arvados.git] / doc / install / install-arv-git-httpd.html.textile.liquid
1 ---
2 layout: default
3 navsection: installguide
4 title: Install the Git server
5 ...
6
7 Arvados allows users to create their own private and public git repositories, and clone/push them using SSH and HTTPS.
8
9 The git hosting setup involves three components.
10 * The "arvados-git-sync.rb" script polls the API server for the current list of repositories, creates bare repositories, and updates the local permission cache used by gitolite.
11 * Gitolite provides SSH access.
12 * arvados-git-http provides HTTPS access.
13
14 It is not strictly necessary to deploy _both_ SSH and HTTPS access, but we recommend deploying both:
15 * SSH is a more appropriate way to authenticate from a user's workstation because it does not require managing tokens on the client side;
16 * HTTPS is a more appropriate way to authenticate from a shell VM because it does not depend on SSH agent forwarding (SSH clients' agent forwarding features tend to behave as if the remote machine is fully trusted).
17
18 The HTTPS instructions given below will not work if you skip the SSH setup steps.
19
20 h2. Set up DNS
21
22 By convention, we use the following hostname for the git service:
23
24 <notextile>
25 <pre><code>git.<span class="userinput">uuid_prefix</span>.your.domain
26 </code></pre>
27 </notextile>
28
29 {% include 'notebox_begin' %}
30 Here, we show how to install the git hosting services *on the same host as your API server.* Using a different host is not yet fully supported. On this page we will refer to it as your git server.
31 {% include 'notebox_end' %}
32
33 DNS and network configuration should be set up so port 443 reaches your HTTPS proxy, and port 22 reaches the OpenSSH service on your git server.
34
35 h2. Generate an API token
36
37 Use the following command to generate an API token, changing *@webserver-user@* to the user of the web server process.  This is typically *@www-data@* on Debian systems by default, other systems may use different defaults such the name of the web server software (for example, *@nginx@*).
38
39 Using RVM:
40
41 <notextile>
42 <pre><code>gitserver:~$ <span class="userinput">cd /var/www/arvados-api/current</span>
43 gitserver:/var/www/arvados-api/current$ <span class="userinput">sudo -u <b>webserver-user</b> RAILS_ENV=production `which rvm-exec` default bundle exec ./script/create_superuser_token.rb</span>
44 zzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzz
45 </code></pre>
46 </notextile>
47
48 Not using RVM:
49
50 <notextile>
51 <pre><code>gitserver:~$ <span class="userinput">cd /var/www/arvados-api/current</span>
52 gitserver:/var/www/arvados-api/current$ <span class="userinput">sudo -u <b>webserver-user</b> RAILS_ENV=production bundle exec ./script/create_superuser_token.rb</span>
53 zzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzz
54 </code></pre>
55 </notextile>
56
57 Copy that token; you'll need it in a minute.
58
59 h2. Install git and other dependencies
60
61 On Debian-based systems:
62
63 <notextile>
64 <pre><code>gitserver:~$ <span class="userinput">sudo apt-get install git openssh-server</span>
65 </code></pre>
66 </notextile>
67
68 On Red Hat-based systems:
69
70 <notextile>
71 <pre><code>gitserver:~$ <span class="userinput">sudo yum install git perl-Data-Dumper openssh-server</span>
72 </code></pre>
73 </notextile>
74
75 {% include 'install_git' %}
76
77 h2. Create a "git" user and a storage directory
78
79 Gitolite and some additional scripts will be installed in @/var/lib/arvados/git@, which means hosted repository data will be stored in @/var/lib/arvados/git/repositories@. If you choose to install gitolite in a different location, make sure to update the @git_repositories_dir@ entry in your API server's @application.yml@ file accordingly: for example, if you install gitolite at @/data/gitolite@ then your @git_repositories_dir@ will be @/data/gitolite/repositories@.
80
81 A new UNIX account called "git" will own the files. This makes git URLs look familiar to users (<code>git@[...]:username/reponame.git</code>).
82
83 On Debian- or Red Hat-based systems:
84
85 <notextile>
86 <pre><code>gitserver:~$ <span class="userinput">sudo mkdir -p /var/lib/arvados/git</span>
87 gitserver:~$ <span class="userinput">sudo useradd --comment git --home-dir /var/lib/arvados/git git</span>
88 gitserver:~$ <span class="userinput">sudo chown -R git:git ~git</span>
89 </code></pre>
90 </notextile>
91
92 The git user needs its own SSH key. (It must be able to run <code>ssh git@localhost</code> from scripts.)
93
94 <notextile>
95 <pre><code>gitserver:~$ <span class="userinput">sudo -u git -i bash</span>
96 git@gitserver:~$ <span class="userinput">ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa</span>
97 git@gitserver:~$ <span class="userinput">cp .ssh/id_rsa.pub .ssh/authorized_keys</span>
98 git@gitserver:~$ <span class="userinput">ssh -o stricthostkeychecking=no localhost cat .ssh/id_rsa.pub</span>
99 Warning: Permanently added 'localhost' (ECDSA) to the list of known hosts.
100 ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABAQC7aBIDAAgMQN16Pg6eHmvc+D+6TljwCGr4YGUBphSdVb25UyBCeAEgzqRiqy0IjQR2BLtSirXr+1SJAcQfBgI/jwR7FG+YIzJ4ND9JFEfcpq20FvWnMMQ6XD3y3xrZ1/h/RdBNwy4QCqjiXuxDpDB7VNP9/oeAzoATPZGhqjPfNS+RRVEQpC6BzZdsR+S838E53URguBOf9yrPwdHvosZn7VC0akeWQerHqaBIpSfDMtaM4+9s1Gdsz0iP85rtj/6U/K/XOuv2CZsuVZZ52nu3soHnEX2nx2IaXMS3L8Z+lfOXB2T6EaJgXF7Z9ME5K1tx9TSNTRcYCiKztXLNLSbp git@gitserver
101 git@gitserver:~$ <span class="userinput">rm .ssh/authorized_keys</span>
102 </code></pre>
103 </notextile>
104
105 h2. Install gitolite
106
107 Check "https://github.com/sitaramc/gitolite/tags":https://github.com/sitaramc/gitolite/tags for the latest stable version. This guide was tested with @v3.6.3@. _Versions below 3.0 are missing some features needed by Arvados, and should not be used._
108
109 Download and install the version you selected.
110
111 <notextile>
112 <pre><code>git@gitserver:~$ <span class="userinput">echo 'PATH=$HOME/bin:$PATH' &gt;.profile</span>
113 git@gitserver:~$ <span class="userinput">source .profile</span>
114 git@gitserver:~$ <span class="userinput">git clone --branch <b>v3.6.3</b> git://github.com/sitaramc/gitolite</span>
115 ...
116 Note: checking out '5d24ae666bfd2fa9093d67c840eb8d686992083f'.
117 ...
118 git@gitserver:~$ <span class="userinput">mkdir bin</span>
119 git@gitserver:~$ <span class="userinput">gitolite/install -ln ~git/bin</span>
120 git@gitserver:~$ <span class="userinput">bin/gitolite setup -pk .ssh/id_rsa.pub</span>
121 Initialized empty Git repository in /var/lib/arvados/git/repositories/gitolite-admin.git/
122 Initialized empty Git repository in /var/lib/arvados/git/repositories/testing.git/
123 WARNING: /var/lib/arvados/git/.ssh/authorized_keys missing; creating a new one
124     (this is normal on a brand new install)
125 </code></pre>
126 </notextile>
127
128 _If this didn't go well, more detail about installing gitolite, and information about how it works, can be found on the "gitolite home page":http://gitolite.com/._
129
130 Clone the gitolite-admin repository. The arvados-git-sync.rb script works by editing the files in this working directory and pushing them to gitolite. Here we make sure "git push" won't produce any errors or warnings.
131
132 <notextile>
133 <pre><code>git@gitserver:~$ <span class="userinput">git clone git@localhost:gitolite-admin</span>
134 Cloning into 'gitolite-admin'...
135 remote: Counting objects: 6, done.
136 remote: Compressing objects: 100% (4/4), done.
137 remote: Total 6 (delta 0), reused 0 (delta 0)
138 Receiving objects: 100% (6/6), done.
139 Checking connectivity... done.
140 git@gitserver:~$ <span class="userinput">cd gitolite-admin</span>
141 git@gitserver:~/gitolite-admin$ <span class="userinput">git config user.email arvados</span>
142 git@gitserver:~/gitolite-admin$ <span class="userinput">git config user.name arvados</span>
143 git@gitserver:~/gitolite-admin$ <span class="userinput">git config push.default simple</span>
144 git@gitserver:~/gitolite-admin$ <span class="userinput">git push</span>
145 Everything up-to-date
146 </code></pre>
147 </notextile>
148
149 h3. Configure gitolite
150
151 Configure gitolite to look up a repository name like @username/reponame.git@ and find the appropriate bare repository storage directory.
152
153 Add the following lines to the top of @~git/.gitolite.rc@:
154
155 <notextile>
156 <pre><code><span class="userinput">my $repo_aliases;
157 my $aliases_src = "$ENV{HOME}/.gitolite/arvadosaliases.pl";
158 if ($ENV{HOME} && (-e $aliases_src)) {
159     $repo_aliases = do $aliases_src;
160 }
161 $repo_aliases ||= {};
162 </span></code></pre>
163 </notextile>
164
165 Add the following lines inside the section that begins @%RC = (@:
166
167 <notextile>
168 <pre><code><span class="userinput">    REPO_ALIASES => $repo_aliases,
169 </span></code></pre>
170 </notextile>
171
172 Inside that section, adjust the 'UMASK' setting to @022@, to ensure the API server has permission to read repositories:
173
174 <notextile>
175 <pre><code>    UMASK => <span class="userinput">022</span>,
176 </code></pre>
177 </notextile>
178
179 Uncomment the 'Alias' line in the section that begins @ENABLE => [@:
180
181 <notextile>
182 <pre><code><span class="userinput">            # access a repo by another (possibly legacy) name
183             'Alias',
184 </span></code></pre>
185 </notextile>
186
187 h2. Configure git synchronization
188
189 Create a configuration file @/var/www/arvados-api/current/config/arvados-clients.yml@ using the following template, filling in the appropriate values for your system.
190 * For @arvados_api_token@, use the token you generated above.
191 * For @gitolite_arvados_git_user_key@, provide the public key you generated above, i.e., the contents of @~git/.ssh/id_rsa.pub@.
192
193 <notextile>
194 <pre><code>production:
195   gitolite_url: /var/lib/arvados/git/repositories/gitolite-admin.git
196   gitolite_tmp: /var/lib/arvados/git
197   arvados_api_host: <span class="userinput">uuid_prefix.example.com</span>
198   arvados_api_token: "<span class="userinput">zzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzz</span>"
199   arvados_api_host_insecure: <span class="userinput">false</span>
200   gitolite_arvados_git_user_key: "<span class="userinput">ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABAQC7aBIDAAgMQN16Pg6eHmvc+D+6TljwCGr4YGUBphSdVb25UyBCeAEgzqRiqy0IjQR2BLtSirXr+1SJAcQfBgI/jwR7FG+YIzJ4ND9JFEfcpq20FvWnMMQ6XD3y3xrZ1/h/RdBNwy4QCqjiXuxDpDB7VNP9/oeAzoATPZGhqjPfNS+RRVEQpC6BzZdsR+S838E53URguBOf9yrPwdHvosZn7VC0akeWQerHqaBIpSfDMtaM4+9s1Gdsz0iP85rtj/6U/K/XOuv2CZsuVZZ52nu3soHnEX2nx2IaXMS3L8Z+lfOXB2T6EaJgXF7Z9ME5K1tx9TSNTRcYCiKztXLNLSbp git@gitserver</span>"
201 </code></pre>
202 </notextile>
203
204 h3. Enable the synchronization script
205
206 The API server package includes a script that retrieves the current set of repository names and permissions from the API, writes them to @arvadosaliases.pl@ in a format usable by gitolite, and triggers gitolite hooks which create new empty repositories if needed. This script should run every 2 to 5 minutes.
207
208 If you are using RVM, create @/etc/cron.d/arvados-git-sync@ with the following content:
209
210 <notextile>
211 <pre><code><span class="userinput">*/5 * * * * git cd /var/www/arvados-api/current && /usr/local/rvm/bin/rvm-exec default bundle exec script/arvados-git-sync.rb production</span>
212 </code></pre>
213 </notextile>
214
215 Otherwise, create @/etc/cron.d/arvados-git-sync@ with the following content:
216
217 <notextile>
218 <pre><code><span class="userinput">*/5 * * * * git cd /var/www/arvados-api/current && bundle exec script/arvados-git-sync.rb production</span>
219 </code></pre>
220 </notextile>
221
222 h3. Configure the API server to advertise the correct SSH URLs
223
224 In your API server's @application.yml@ file, add the following entry:
225
226 <notextile>
227 <pre><code>git_repo_ssh_base: "git@git.<span class="userinput">uuid_prefix.your.domain</span>:"
228 </code></pre>
229 </notextile>
230
231 Make sure to include the trailing colon.
232
233 h2. Install the arvados-git-httpd package
234
235 This is needed only for HTTPS access.
236
237 The arvados-git-httpd package provides HTTP access, using Arvados authentication tokens instead of passwords. It is intended to be installed on the system where your git repositories are stored, and accessed through a web proxy that provides SSL support.
238
239 On Debian-based systems:
240
241 <notextile>
242 <pre><code>~$ <span class="userinput">sudo apt-get install git arvados-git-httpd</span>
243 </code></pre>
244 </notextile>
245
246 On Red Hat-based systems:
247
248 <notextile>
249 <pre><code>~$ <span class="userinput">sudo yum install git arvados-git-httpd</span>
250 </code></pre>
251 </notextile>
252
253 Verify that @arvados-git-httpd@ and @git-http-backend@ can be run:
254
255 <notextile>
256 <pre><code>~$ <span class="userinput">arvados-git-httpd -h</span>
257 Usage of arvados-git-httpd:
258   -address="0.0.0.0:80": Address to listen on, "host:port".
259   -git-command="/usr/bin/git": Path to git executable. Each authenticated request will execute this program with a single argument, "http-backend".
260   -repo-root="/path/to/cwd": Path to git repositories.
261 ~$ <span class="userinput">git http-backend</span>
262 Status: 500 Internal Server Error
263 Expires: Fri, 01 Jan 1980 00:00:00 GMT
264 Pragma: no-cache
265 Cache-Control: no-cache, max-age=0, must-revalidate
266
267 fatal: No REQUEST_METHOD from server
268 </code></pre>
269 </notextile>
270
271 h3. Enable arvados-git-httpd
272
273 On Debian-based systems, install runit:
274
275 <notextile>
276 <pre><code>~$ <span class="userinput">sudo apt-get install runit</span>
277 </code></pre>
278 </notextile>
279
280 On Red Hat-based systems, "install runit from source":http://smarden.org/runit/install.html or use an alternative daemon supervisor.
281
282 Configure runit to run arvados-git-httpd, making sure to update the API host to match your site:
283
284 <notextile>
285 <pre><code>~$ <span class="userinput">cd /etc/sv</span>
286 /etc/sv$ <span class="userinput">sudo mkdir arvados-git-httpd; cd arvados-git-httpd</span>
287 /etc/sv/arvados-git-httpd$ <span class="userinput">sudo mkdir log</span>
288 /etc/sv/arvados-git-httpd$ <span class="userinput">sudo sh -c 'cat &gt;log/run' &lt;&lt;'EOF'
289 #!/bin/sh
290 mkdir -p main
291 chown git:git main
292 exec chpst -u git:git svlogd -tt main
293 EOF</span>
294 /etc/sv/arvados-git-httpd$ <span class="userinput">sudo sh -c 'cat &gt;run' &lt;&lt;'EOF'
295 #!/bin/sh
296 export ARVADOS_API_HOST=<b>uuid_prefix.your.domain</b>
297 export GITOLITE_HTTP_HOME=/var/lib/arvados/git
298 export GL_BYPASS_ACCESS_CHECKS=1
299 export PATH="$PATH:/var/lib/arvados/git/bin"
300 exec chpst -u git:git arvados-git-httpd -address=:9001 -git-command=/var/lib/arvados/git/gitolite/src/gitolite-shell -repo-root=<b>/var/lib/arvados/git</b>/repositories 2&gt;&1
301 EOF</span>
302 /etc/sv/arvados-git-httpd$ <span class="userinput">sudo chmod +x run log/run</span>
303 </code></pre>
304 </notextile>
305
306 If you are using a different daemon supervisor, or if you want to test the daemon in a terminal window, an equivalent shell command to run arvados-git-httpd is:
307
308 <notextile>
309 <pre><code>sudo -u git \
310   ARVADOS_API_HOST=<span class="userinput">uuid_prefix.your.domain</span> \
311   GITOLITE_HTTP_HOME=/var/lib/arvados/git \
312   GL_BYPASS_ACCESS_CHECKS=1 \
313   PATH="$PATH:/var/lib/arvados/git/bin" \
314   arvados-git-httpd -address=:9001 -git-command=/var/lib/arvados/git/gitolite/src/gitolite-shell -repo-root=/var/lib/arvados/git/repositories 2&gt;&1
315 </code></pre>
316 </notextile>
317
318 h3. Set up a reverse proxy to provide SSL service
319
320 The arvados-git-httpd service will be accessible from anywhere on the internet, so we recommend using SSL.
321
322 This is best achieved by putting a reverse proxy with SSL support in front of arvados-git-httpd, running on port 443 and passing requests to @arvados-git-httpd@ on port 9001 (or whichever port you used in your run script).
323
324 Add the following configuration to the @http@ section of your Nginx configuration:
325
326 <notextile>
327 <pre><code>
328 upstream arvados-git-httpd {
329   server                  127.0.0.1:<span class="userinput">9001</span>;
330 }
331 server {
332   listen                  <span class="userinput">[your public IP address]</span>:443 ssl;
333   server_name             git.<span class="userinput">uuid_prefix.your.domain</span>;
334   proxy_connect_timeout   90s;
335   proxy_read_timeout      300s;
336
337   ssl on;
338   ssl_certificate         <span class="userinput">/YOUR/PATH/TO/cert.pem</span>;
339   ssl_certificate_key     <span class="userinput">/YOUR/PATH/TO/cert.key</span>;
340
341   location  / {
342     proxy_pass            http://arvados-git-httpd;
343   }
344 }
345 </code></pre>
346 </notextile>
347
348 h3. Configure the API server to advertise the correct HTTPS URLs
349
350 In your API server's @application.yml@ file, add the following entry:
351
352 <notextile>
353 <pre><code>git_repo_http_base: https://git.<span class="userinput">uuid_prefix.your.domain</span>/
354 </code></pre>
355 </notextile>
356
357 Make sure to include the trailing slash.
358
359 h2. Restart Nginx
360
361 Restart Nginx to make the Nginx and API server configuration changes take effect.
362
363 <notextile>
364 <pre><code>gitserver:~$ <span class="userinput">sudo nginx -s reload</span>
365 </code></pre>
366 </notextile>