14714: Updates/adds keep-balance docs
[arvados.git] / doc / admin / troubleshooting.html.textile.liquid
1 ---
2 layout: default
3 navsection: admin
4 title: Troubleshooting
5 ...
6
7 {% comment %}
8 Copyright (C) The Arvados Authors. All rights reserved.
9
10 SPDX-License-Identifier: CC-BY-SA-3.0
11 {% endcomment %}
12
13 Using a distributed system with several services working together sometimes makes it difficult to find the root cause of errors, as one single client request usually means several different requests to more than one service.
14
15 To deal with this difficulty, Arvados creates a request ID that gets carried over different services as the requests take place. This ID has a specific format and it's comprised of the prefix "@req-@" followed by 20 random alphanumeric characters:
16
17 <pre>req-frdyrcgdh4rau1ajiq5q</pre>
18
19 This ID gets propagated via an HTTP @X-Request-Id@ header, and gets logged on every service.
20
21 h3. API Server error reporting and logging
22
23 In addition to providing the request ID on every HTTP response, the API Server adds it to every error message so that all clients show enough information to the user to be able to track a particular issue. As an example, let's suppose that we get the following error when trying to create a collection using the CLI tools:
24
25 <pre>
26 $ arv collection create --collection '{}'
27 Error: #<RuntimeError: Whoops, something bad happened> (req-ku5ct9ehw0y71f1c5p79)
28 </pre>
29
30 The API Server logs every request in JSON format on the @production.log@ (usually under @/var/www/arvados-api/current/log/@ when installing from packages) file, so we can retrieve more information about this by using @grep@ and @jq@ tools:
31
32 <pre>
33 # grep req-ku5ct9ehw0y71f1c5p79 /var/www/arvados-api/current/log/production.log | jq .
34 {
35   "method": "POST",
36   "path": "/arvados/v1/collections",
37   "format": "json",
38   "controller": "Arvados::V1::CollectionsController",
39   "action": "create",
40   "status": 422,
41   "duration": 1.52,
42   "view": 0.25,
43   "db": 0,
44   "request_id": "req-ku5ct9ehw0y71f1c5p79",
45   "client_ipaddr": "127.0.0.1",
46   "client_auth": "zzzzz-gj3su-jllemyj9v3s5emu",
47   "exception": "#<RuntimeError: Whoops, something bad happened>",
48   "exception_backtrace": "/var/www/arvados-api/current/app/controllers/arvados/v1/collections_controller.rb:43:in `create'\n/var/lib/gems/ruby/2.3.0/gems/actionpack-5.0.7.2/lib/action_controller/metal/basic_implicit_render.rb:4:in `send_action'\n ...[snipped]",
49   "params": {
50     "collection": "{}",
51     "_profile": "true",
52     "cluster_id": "",
53     "collection_given": "true",
54     "ensure_unique_name": "false",
55     "help": "false"
56   },
57   "@timestamp": "2019-07-15T16:40:41.726634182Z",
58   "@version": "1",
59   "message": "[422] POST /arvados/v1/collections (Arvados::V1::CollectionsController#create)"
60 }
61 </pre>
62
63 When logging a request that produced an error, the API Server adds @exception@ and @exception_backtrace@ keys to the JSON log. The latter includes the complete error stack trace as a string, and can be displayed in a more readable form like so:
64
65 <pre>
66 # grep req-ku5ct9ehw0y71f1c5p79 /var/www/arvados-api/current/log/production.log | jq -r .exception_backtrace
67 /var/www/arvados-api/current/app/controllers/arvados/v1/collections_controller.rb:43:in `create'
68 /var/lib/gems/ruby/2.3.0/gems/actionpack-5.0.7.2/lib/action_controller/metal/basic_implicit_render.rb:4:in `send_action'
69 /var/lib/gems/ruby/2.3.0/gems/actionpack-5.0.7.2/lib/abstract_controller/base.rb:188:in `process_action'
70 /var/lib/gems/ruby/2.3.0/gems/actionpack-5.0.7.2/lib/action_controller/metal/rendering.rb:30:in `process_action'
71 /var/lib/gems/ruby/2.3.0/gems/actionpack-5.0.7.2/lib/abstract_controller/callbacks.rb:20:in `block in process_action'
72 /var/lib/gems/ruby/2.3.0/gems/activesupport-5.0.7.2/lib/active_support/callbacks.rb:126:in `call'
73 ...
74 </pre>