Merge branch '21020-pysdk-env-paths'
[arvados.git] / doc / sdk / python / api-client.html.textile.liquid
1 ---
2 layout: default
3 navsection: sdk
4 navmenu: Python
5 title: Arvados API Client
6 ...
7 {% comment %}
8 Copyright (C) The Arvados Authors. All rights reserved.
9
10 SPDX-License-Identifier: CC-BY-SA-3.0
11 {% endcomment %}
12 {% comment %}
13 A note about scope for future authors: This page is meant to be a general guide to using the API client. It is intentionally limited to using the general resource methods as examples, because those are widely available and should be sufficient to give the reader a general understanding of how the API client works. In my opinion we should not cover resource-specific API methods here, and instead prefer to cover them in the cookbook or reference documentation, which have a more appropriate scope.  --Brett 2022-12-06
14 {% endcomment %}
15
16 The Arvados Python SDK provides a complete client interface to the "Arvados API":{{site.baseurl}}/api/index.html. You can use this client interface directly to send requests to your Arvados API server, and many of the higher-level interfaces in the Python SDK accept a client object in their constructor for their use. Any Arvados software you write in Python will likely use these client objects.
17
18 This document explains how to instantiate the client object, and how its methods map to the full "Arvados API":{{site.baseurl}}/api/index.html. Refer to the API documentation for full details about all available resources and methods. The rest of the Python SDK documentation after this covers the higher-level interfaces it provides.
19
20 h2. Initializing the API client
21
22 In the simplest case, you can import the @arvados@ module and call its @api@ method with an API version number:
23
24 {% codeblock as python %}
25 import arvados
26 arv_client = arvados.api('v1')
27 {% endcodeblock %}
28
29 When called this way, the SDK gets Arvados API credentials from the first source it finds in this list:
30
31 # The environment variables @ARVADOS_API_HOST@, @ARVADOS_API_TOKEN@, and @ARVADOS_API_HOST_INSECURE@.
32 # The @settings.conf@ file under the directories listed in systemd's @CONFIGURATION_DIRECTORY@ environment variable.
33 # The @arvados/settings.conf@ file under the directory in the @XDG_CONFIG_HOME@ environment variable. This defaults to @~/.config/arvados/settings.conf@ if @XDG_CONFIG_HOME@ is not set.
34 # The @arvados/settings.conf@ file under the directories in the @XDG_CONFIG_DIRS@ environment variable.
35
36 You can alternatively pass these settings as arguments:
37
38 {% codeblock as python %}
39 import arvados
40 arv_client = arvados.api(
41     'v1',
42     host='api.arvados.example.com',
43     token='ExampleToken',
44     insecure=False,
45 )
46 {% endcodeblock %}
47
48 Either way, you can now use the @arv_client@ object to send requests to the Arvados API server you specified, using the configured token. The client object queries the API server for its supported API version and methods, so this client object will always support the same API the server does, even when there is a version mismatch between it and the Python SDK.
49
50 h2. Resources, methods, and requests
51
52 The API client has a method that corresponds to each "type of resource supported by the Arvados API server":{{site.baseurl}}/api/ (listed in the documentation sidebar). You call these methods without any arguments. They return a resource object you use to call a method on that resource type.
53
54 Each resource object has a method that corresponds to each API method supported by that resource type. You call these methods with the keyword arguments and values documented in the API reference. They return an API request object.
55
56 Each API request object has an @execute()@ method. If it succeeds, it returns the kind of object documented in the API reference for that method. Usually that's a dictionary with details about the object you requested. If there's a problem, it raises an exception.
57
58 Putting it all together, basic API requests usually look like:
59
60 {% codeblock as python %}
61 arv_object = arv_client.resource_type().api_method(
62     argument=...,
63     other_argument=...,
64 ).execute()
65 {% endcodeblock %}
66
67 Later sections detail how to call "common resource methods in the API":{{site.baseurl}}/api/methods.html with more concrete examples. Additional methods may be available on specific resource types.
68
69 h3. Retrying failed requests
70
71 If you execute an API request and it fails because of a temporary error like a network problem, the SDK waits with randomized exponential back-off, then retries the request. You can specify the maximum number of retries by passing a @num_retries@ integer to either @arvados.api@ or the @execute()@ method; the SDK will use whichever number is greater. The default number of retries is 10, which means that an API request could take up to about 35 minutes if the temporary problem persists that long. To disable automatic retries, just pass @num_retries=0@ to @arvados.api@:
72
73 {% codeblock as python %}
74 import arvados
75 arv_client = arvados.api('v1', num_retries=0, ...)
76 {% endcodeblock %}
77
78 h2. get method
79
80 To fetch a single Arvados object, call the @get@ method of the resource type. You must pass a @uuid@ argument string that identifies the object to fetch. The method returns a dictionary with the object's fields.
81
82 {% codeblock as python %}
83 # Get a workflow and output its Common Workflow Language definition
84 workflow = api.workflows().get(uuid='zzzzz-7fd4e-12345abcde67890').execute()
85 print(workflow['definition'])
86 {% endcodeblock %}
87
88 You can pass a @select@ argument that's a list of field names to return in the included object. Doing this avoids the overhead of de/serializing and transmitting data that you won't use. Skipping a large field over a series of requests can yield a noticeable performance improvement.
89
90 {% codeblock as python %}
91 # Get a workflow and output its name and description.
92 # Don't load the workflow definition, which might be large and we're not going to use.
93 workflow = api.workflows().get(
94     uuid='zzzzz-7fd4e-12345abcde67890',
95     select=['name', 'description'],
96 ).execute()
97 print(f"## {workflow['name']} ##\n\n{workflow['description']}")
98
99 # ERROR: This raises a KeyError because we didn't load this field in
100 # the `select` argument.
101 workflow['created_at']
102 {% endcodeblock %}
103
104 h2. list method
105
106 To fetch multiple Arvados objects of the same type, call the @list@ method for that resource type. The list method takes a number of arguments. Refer to the "list method API reference":{{site.baseurl}}/api/methods.html#index for details about them. The method returns a dictionary also documented at the bottom of that section. The most interesting field is @'items'@, which is a list of dictionaries where each one corresponds to an Arvados object that matched your search. To work with a single page of results:
107
108 {% codeblock as python %}
109 # Output the exit codes of the 10 most recently run containers.
110 container_list = arv_client.containers().list(
111     limit=10,
112     order=['finished_at desc'],
113 ).execute()
114 for container in container_list['items']:
115     print(f"{container['uuid']}: {container['exit_code']}")
116 {% endcodeblock %}
117
118 If you need to retrieve all of the results for a query, you may need to call the @list@ method multiple times: the default @limit@ is 100 items, and the API server will never return more than 1000. The SDK function @arvados.util.keyset_list_all@ can help orchestrate this for you. Call it with the @list@ method you want to query (don't call it yourself!) and the same keyword arguments you would pass to that method. You can control ordering by passing an @order_key@ string that names the field to use, and an @ascending@ bool that indicates whether that key should be sorted in ascending or descending order. The function returns an iterator of dictionaries, where each dictionary corresponds to an Arvados object that matched your query.
119
120 {% codeblock as python %}
121 # Output all the portable data hashes in a project.
122 project_data = set()
123 for collection in arvados.util.keyset_list_all(
124     # Note we pass the `list` method without calling it
125     arv_client.collections().list,
126     # The UUID of the project we're searching
127     filters=[['owner_uuid', '=', 'zzzzz-j7d0g-12345abcde67890']],
128 ):
129     project_data.add(collection['portable_data_hash'])
130 print('\n'.join(project_data))
131 {% endcodeblock %}
132
133 When you list many objects, the following can help improve performance:
134
135 * Call the list method with @count='none'@ to avoid the overhead of counting all results with each request.
136 * Call the list method with a @select@ argument to only request the data you need. This cuts out some overhead from de/serializing and transferring data you won't use.
137
138 h2. create method
139
140 To create a new Arvados object, call the @create@ method for that resource type. You must pass a @body@ dictionary with a single item. Its key is the resource type you're creating as a string, and its value is dictionary of data fields for that resource. The method returns a dictionary with the new object's fields.
141
142 If the resource type has a @name@ field, you may pass an @ensure_unique_name@ boolean argument. If true, the method will automatically update the name of the new object to make it unique if necessary.
143
144 {% codeblock as python %}
145 # Create a new project and output its UUID.
146 project = arv_client.groups().create(
147     body={
148         'group': {
149             'name': 'Python SDK Test Project',
150             'group_class': 'project',
151         },
152     },
153     ensure_unique_name=True,
154 ).execute()
155 print(project['uuid'])
156 {% endcodeblock %}
157
158 h2. update method
159
160 To modify an existing Arvados object, call the @update@ method for that resource type. You must pass a @uuid@ string argument that identifies the object to update, and a @body@ dictionary with a single item. Its key is the resource type you're creating as a string, and its value is dictionary of data fields to update on the resource. The method returns a dictionary with the updated object's fields.
161
162 If the resource type has a @name@ field, you may pass an @ensure_unique_name@ boolean argument. If true, the method will automatically update the name of the new object to make it unique if necessary.
163
164 {% codeblock as python %}
165 # Update the name of a container request,
166 # finalize it to submit it to Crunch for processing,
167 # and output its priority.
168 submitted_container_request = arv_client.container_requests().update(
169     uuid='zzzzz-xvhdp-12345abcde67890',
170     body={
171         'container_request': {
172             'name': 'Container Request Committed by Python SDK',
173             'state': 'Committed',
174         },
175     },
176     ensure_unique_name=True,
177 ).execute()
178 print(submitted_container_request['priority'])
179 {% endcodeblock %}
180
181 h2. delete method
182
183 To delete an existing Arvados object, call the @delete@ method for that resource type. You must pass a @uuid@ string argument that identifies the object to delete. The method returns a dictionary with the deleted object's fields.
184
185 {% codeblock as python %}
186 # Delete a collection and output its name
187 deleted_collection = arv_client.collections().delete(
188     uuid='zzzzz-4zz18-12345abcde67890',
189 ).execute()
190 print(deleted_collection['name'])
191 {% endcodeblock %}
192
193 For resource types that support being trashed, you can untrash the object by calling the resource type's @untrash@ method with a @uuid@ argument identifying the object to restore.