Merge branch '21762-flaky-search-test'
[arvados.git] / services / api / app / models / arvados_model.rb
1 # Copyright (C) The Arvados Authors. All rights reserved.
2 #
3 # SPDX-License-Identifier: AGPL-3.0
4
5 require 'arvados_model_updates'
6 require 'has_uuid'
7 require 'record_filters'
8 require 'serializers'
9 require 'request_error'
10
11 class ArvadosModel < ApplicationRecord
12   self.abstract_class = true
13
14   include ArvadosModelUpdates
15   include CurrentApiClient      # current_user, current_api_client, etc.
16   include DbCurrentTime
17   extend RecordFilters
18
19   after_find :schedule_restoring_changes
20   after_initialize :log_start_state
21   before_save :ensure_permission_to_save
22   before_save :ensure_owner_uuid_is_permitted
23   before_save :ensure_ownership_path_leads_to_user
24   before_destroy :ensure_owner_uuid_is_permitted
25   before_destroy :ensure_permission_to_destroy
26   before_create :update_modified_by_fields
27   before_create :add_uuid_to_name, :if => Proc.new { @_add_uuid_to_name }
28   before_update :maybe_update_modified_by_fields
29   after_create :log_create
30   after_update :log_update
31   after_destroy :log_destroy
32   before_validation :normalize_collection_uuids
33   before_validation :set_default_owner
34   validate :ensure_valid_uuids
35
36   # Note: This only returns permission links. It does not account for
37   # permissions obtained via user.is_admin or
38   # user.uuid==object.owner_uuid.
39   has_many(:permissions,
40            ->{where(link_class: 'permission')},
41            foreign_key: 'head_uuid',
42            class_name: 'Link',
43            primary_key: 'uuid')
44
45   # If async is true at create or update, permission graph
46   # update is deferred allowing making multiple calls without the performance
47   # penalty.
48   attr_accessor :async_permissions_update
49
50   # Ignore listed attributes on mass assignments
51   def self.protected_attributes
52     []
53   end
54
55   class PermissionDeniedError < RequestError
56     def http_status
57       403
58     end
59   end
60
61   class AlreadyLockedError < RequestError
62     def http_status
63       422
64     end
65   end
66
67   class LockFailedError < RequestError
68     def http_status
69       422
70     end
71   end
72
73   class InvalidStateTransitionError < RequestError
74     def http_status
75       422
76     end
77   end
78
79   class UnauthorizedError < RequestError
80     def http_status
81       401
82     end
83   end
84
85   class UnresolvableContainerError < RequestError
86     def http_status
87       422
88     end
89   end
90
91   def self.kind_class(kind)
92     kind.match(/^arvados\#(.+)$/)[1].classify.safe_constantize rescue nil
93   end
94
95   def href
96     "#{current_api_base}/#{self.class.to_s.pluralize.underscore}/#{self.uuid}"
97   end
98
99   def self.permit_attribute_params raw_params
100     # strong_parameters does not provide security: permissions are
101     # implemented with before_save hooks.
102     #
103     # The following permit! is necessary even with
104     # "ActionController::Parameters.permit_all_parameters = true",
105     # because permit_all does not permit nested attributes.
106     raw_params ||= {}
107
108     if raw_params
109       raw_params = raw_params.to_hash
110       raw_params.delete_if { |k, _| self.protected_attributes.include? k }
111       serialized_attributes.each do |colname, coder|
112         param = raw_params[colname.to_sym]
113         if param.nil?
114           # ok
115         elsif !param.is_a?(coder.object_class)
116           raise ArgumentError.new("#{colname} parameter must be #{coder.object_class}, not #{param.class}")
117         elsif has_nonstring_keys?(param)
118           raise ArgumentError.new("#{colname} parameter cannot have non-string hash keys")
119         end
120       end
121       # Check JSONB columns that aren't listed on serialized_attributes
122       columns.select{|c| c.type == :jsonb}.collect{|j| j.name}.each do |colname|
123         if serialized_attributes.include? colname || raw_params[colname.to_sym].nil?
124           next
125         end
126         if has_nonstring_keys?(raw_params[colname.to_sym])
127           raise ArgumentError.new("#{colname} parameter cannot have non-string hash keys")
128         end
129       end
130     end
131     ActionController::Parameters.new(raw_params).permit!
132   end
133
134   def initialize raw_params={}, *args
135     super(self.class.permit_attribute_params(raw_params), *args)
136   end
137
138   # Reload "old attributes" for logging, too.
139   def reload(*args)
140     super
141     log_start_state
142     self
143   end
144
145   def self.create raw_params={}, *args
146     super(permit_attribute_params(raw_params), *args)
147   end
148
149   def update raw_params={}, *args
150     super(self.class.permit_attribute_params(raw_params), *args)
151   end
152
153   def self.selectable_attributes(template=:user)
154     # Return an array of attribute name strings that can be selected
155     # in the given template.
156     api_accessible_attributes(template).map { |attr_spec| attr_spec.first.to_s }
157   end
158
159   def self.searchable_columns operator
160     textonly_operator = !operator.match(/[<=>]/) && !operator.in?(['in', 'not in'])
161     self.columns.select do |col|
162       case col.type
163       when :string, :text
164         true
165       when :datetime, :integer, :boolean
166         !textonly_operator
167       else
168         false
169       end
170     end.map(&:name)
171   end
172
173   def self.attribute_column attr
174     self.columns.select { |col| col.name == attr.to_s }.first
175   end
176
177   def self.attributes_required_columns
178     # This method returns a hash.  Each key is the name of an API attribute,
179     # and it's mapped to a list of database columns that must be fetched
180     # to generate that attribute.
181     # This implementation generates a simple map of attributes to
182     # matching column names.  Subclasses can override this method
183     # to specify that method-backed API attributes need to fetch
184     # specific columns from the database.
185     all_columns = columns.map(&:name)
186     api_column_map = Hash.new { |hash, key| hash[key] = [] }
187     methods.grep(/^api_accessible_\w+$/).each do |method_name|
188       next if method_name == :api_accessible_attributes
189       send(method_name).each_pair do |api_attr_name, col_name|
190         col_name = col_name.to_s
191         if all_columns.include?(col_name)
192           api_column_map[api_attr_name.to_s] |= [col_name]
193         end
194       end
195     end
196     api_column_map
197   end
198
199   def self.ignored_select_attributes
200     ["href", "kind", "etag"]
201   end
202
203   def self.columns_for_attributes(select_attributes)
204     if select_attributes.empty?
205       raise ArgumentError.new("Attribute selection list cannot be empty")
206     end
207     api_column_map = attributes_required_columns
208     invalid_attrs = []
209     select_attributes.each do |s|
210       next if ignored_select_attributes.include? s
211       if not s.is_a? String or not api_column_map.include? s
212         invalid_attrs << s
213       end
214     end
215     if not invalid_attrs.empty?
216       raise ArgumentError.new("Invalid attribute(s): #{invalid_attrs.inspect}")
217     end
218     # Given an array of attribute names to select, return an array of column
219     # names that must be fetched from the database to satisfy the request.
220     select_attributes.flat_map { |attr| api_column_map[attr] }.uniq
221   end
222
223   def self.default_orders
224     ["#{table_name}.modified_at desc", "#{table_name}.uuid desc"]
225   end
226
227   def self.unique_columns
228     ["id", "uuid"]
229   end
230
231   def self.limit_index_columns_read
232     # This method returns a list of column names.
233     # If an index request reads that column from the database,
234     # APIs that return lists will only fetch objects until reaching
235     # max_index_database_read bytes of data from those columns.
236     []
237   end
238
239   # If current user can manage the object, return an array of uuids of
240   # users and groups that have permission to write the object. The
241   # first two elements are always [self.owner_uuid, current user's
242   # uuid].
243   #
244   # If current user can write but not manage the object, return
245   # [self.owner_uuid, current user's uuid].
246   #
247   # If current user cannot write this object, just return
248   # [self.owner_uuid].
249   def writable_by
250     # Return [] if this is a frozen project and the current user can't
251     # unfreeze
252     return [] if respond_to?(:frozen_by_uuid) && frozen_by_uuid &&
253                  (Rails.configuration.API.UnfreezeProjectRequiresAdmin ?
254                     !current_user.andand.is_admin :
255                     !current_user.can?(manage: uuid))
256     # Return [] if nobody can write because this object is inside a
257     # frozen project
258     return [] if FrozenGroup.where(uuid: owner_uuid).any?
259     return [owner_uuid] if not current_user
260     unless (owner_uuid == current_user.uuid or
261             current_user.is_admin or
262             (current_user.groups_i_can(:manage) & [uuid, owner_uuid]).any?)
263       if ((current_user.groups_i_can(:write) + [current_user.uuid]) &
264           [uuid, owner_uuid]).any?
265         return [owner_uuid, current_user.uuid]
266       else
267         return [owner_uuid]
268       end
269     end
270     [owner_uuid, current_user.uuid] + permissions.collect do |p|
271       if ['can_write', 'can_manage'].index p.name
272         p.tail_uuid
273       end
274     end.compact.uniq
275   end
276
277   def can_write
278     if respond_to?(:frozen_by_uuid) && frozen_by_uuid
279       # This special case is needed to return the correct value from a
280       # "freeze project" API, during which writable status changes
281       # from true to false.
282       #
283       # current_user.can?(write: self) returns true (which is correct
284       # in the context of permission-checking hooks) but the can_write
285       # value we're returning to the caller here represents the state
286       # _after_ the update, i.e., false.
287       return false
288     else
289       return current_user.can?(write: self)
290     end
291   end
292
293   def can_manage
294     return current_user.can?(manage: self)
295   end
296
297   # Return a query with read permissions restricted to the union of the
298   # permissions of the members of users_list, i.e. if something is readable by
299   # any user in users_list, it will be readable in the query returned by this
300   # function.
301   def self.readable_by(*users_list)
302     # Get rid of troublesome nils
303     users_list.compact!
304
305     # Load optional keyword arguments, if they exist.
306     if users_list.last.is_a? Hash
307       kwargs = users_list.pop
308     else
309       kwargs = {}
310     end
311
312     # Collect the UUIDs of the authorized users.
313     sql_table = kwargs.fetch(:table_name, table_name)
314     include_trash = kwargs.fetch(:include_trash, false)
315     include_old_versions = kwargs.fetch(:include_old_versions, false)
316
317     sql_conds = nil
318     user_uuids = users_list.map { |u| u.uuid }
319     all_user_uuids = []
320
321     admin = users_list.select { |u| u.is_admin }.any?
322
323     # For details on how the trashed_groups table is constructed, see
324     # see db/migrate/20200501150153_permission_table.rb
325
326     # excluded_trash is a SQL expression that determines whether a row
327     # should be excluded from the results due to being trashed.
328     # Trashed items inside frozen projects are invisible to regular
329     # (non-admin) users even when using include_trash, so we have:
330     #
331     # (item_trashed || item_inside_trashed_project)
332     # &&
333     # (!caller_requests_include_trash ||
334     #  (item_inside_frozen_project && caller_is_not_admin))
335     if (admin && include_trash) || sql_table == "api_client_authorizations"
336       excluded_trash = "false"
337     else
338       excluded_trash = "(#{sql_table}.owner_uuid IN (SELECT group_uuid FROM #{TRASHED_GROUPS} " +
339                        "WHERE trash_at <= statement_timestamp()))"
340       if sql_table == "groups" || sql_table == "collections"
341         excluded_trash = "(#{excluded_trash} OR #{sql_table}.trash_at <= statement_timestamp() IS TRUE)"
342       end
343
344       if include_trash
345         # Exclude trash inside frozen projects
346         excluded_trash = "(#{excluded_trash} AND #{sql_table}.owner_uuid IN (SELECT uuid FROM #{FROZEN_GROUPS}))"
347       end
348     end
349
350     if admin
351       # Admin skips most permission checks, but still want to filter
352       # on trashed items.
353       if !include_trash && sql_table != "api_client_authorizations"
354         # Only include records where the owner is not trashed
355         sql_conds = "NOT (#{excluded_trash})"
356       end
357     else
358       # The core of the permission check is a join against the
359       # materialized_permissions table to determine if the user has at
360       # least read permission to either the object itself or its
361       # direct owner (if traverse_owned is true).  See
362       # db/migrate/20200501150153_permission_table.rb for details on
363       # how the permissions are computed.
364
365       # A user can have can_manage access to another user, this grants
366       # full access to all that user's stuff.  To implement that we
367       # need to include those other users in the permission query.
368
369       # This was previously implemented by embedding the subquery
370       # directly into the query, but it was discovered later that this
371       # causes the Postgres query planner to do silly things because
372       # the query heuristics assumed the subquery would have a lot
373       # more rows that it does, and choose a bad merge strategy.  By
374       # doing the query here and embedding the result as a constant,
375       # Postgres also knows exactly how many items there are and can
376       # choose the right query strategy.
377       #
378       # (note: you could also do this with a temporary table, but that
379       # would require all every request be wrapped in a transaction,
380       # which is not currently the case).
381
382       all_user_uuids = ActiveRecord::Base.connection.exec_query %{
383 #{USER_UUIDS_SUBQUERY_TEMPLATE % {user: "'#{user_uuids.join "', '"}'", perm_level: 1}}
384 },
385                                              'readable_by.user_uuids'
386
387       user_uuids_subquery = ":user_uuids"
388
389       # Note: it is possible to combine the direct_check and
390       # owner_check into a single IN (SELECT) clause, however it turns
391       # out query optimizer doesn't like it and forces a sequential
392       # table scan.  Constructing the query with separate IN (SELECT)
393       # clauses enables it to use the index.
394       #
395       # see issue 13208 for details.
396
397       # Match a direct read permission link from the user to the record uuid
398       direct_check = "#{sql_table}.uuid IN (SELECT target_uuid FROM #{PERMISSION_VIEW} "+
399                      "WHERE user_uuid IN (#{user_uuids_subquery}) AND perm_level >= 1)"
400
401       # Match a read permission for the user to the record's
402       # owner_uuid.  This is so we can have a permissions table that
403       # mostly consists of users and groups (projects are a type of
404       # group) and not have to compute and list user permission to
405       # every single object in the system.
406       #
407       # Don't do this for API keys (special behavior) or groups
408       # (already covered by direct_check).
409       #
410       # The traverse_owned flag indicates whether the permission to
411       # read an object also implies transitive permission to read
412       # things the object owns.  The situation where this is important
413       # are determining if we can read an object owned by another
414       # user.  This makes it possible to have permission to read the
415       # user record without granting permission to read things the
416       # other user owns.
417       owner_check = ""
418       if sql_table != "api_client_authorizations" and sql_table != "groups" then
419         owner_check = "#{sql_table}.owner_uuid IN (SELECT target_uuid FROM #{PERMISSION_VIEW} "+
420                       "WHERE user_uuid IN (#{user_uuids_subquery}) AND perm_level >= 1 AND traverse_owned) "
421
422         # We want to do owner_check before direct_check in the OR
423         # clause.  The order of the OR clause isn't supposed to
424         # matter, but in practice, it does -- apparently in the
425         # absence of other hints, it uses the ordering from the query.
426         # For certain types of queries (like filtering on owner_uuid),
427         # every item will match the owner_check clause, so then
428         # Postgres will optimize out the direct_check entirely.
429         direct_check = " OR " + direct_check
430       end
431
432       if Rails.configuration.Users.RoleGroupsVisibleToAll &&
433          sql_table == "groups" &&
434          users_list.select { |u| u.is_active }.any?
435         # All role groups are readable (but we still need the other
436         # direct_check clauses to handle non-role groups).
437         direct_check += " OR #{sql_table}.group_class = 'role'"
438       end
439
440       links_cond = ""
441       if sql_table == "links"
442         # 1) Match permission links incoming or outgoing on the
443         # user, i.e. granting permission on the user, or granting
444         # permission to the user.
445         #
446         # 2) Match permission links which grant permission on an
447         # object that this user can_manage.
448         #
449         links_cond = "OR (#{sql_table}.link_class IN (:permission_link_classes) AND "+
450                      "   ((#{sql_table}.head_uuid IN (#{user_uuids_subquery}) OR #{sql_table}.tail_uuid IN (#{user_uuids_subquery})) OR " +
451                      "    #{sql_table}.head_uuid IN (SELECT target_uuid FROM #{PERMISSION_VIEW} "+
452                      "    WHERE user_uuid IN (#{user_uuids_subquery}) AND perm_level >= 3))) "
453       end
454
455       sql_conds = "(#{owner_check} #{direct_check} #{links_cond}) AND NOT (#{excluded_trash})"
456
457     end
458
459     if !include_old_versions && sql_table == "collections"
460       exclude_old_versions = "#{sql_table}.uuid = #{sql_table}.current_version_uuid"
461       if sql_conds.nil?
462         sql_conds = exclude_old_versions
463       else
464         sql_conds += " AND #{exclude_old_versions}"
465       end
466     end
467
468     return self if sql_conds == nil
469     self.where(sql_conds,
470                user_uuids: all_user_uuids.collect{|c| c["target_uuid"]},
471                permission_link_classes: ['permission'])
472   end
473
474   def save_with_unique_name!
475     max_retries = 2
476     transaction do
477       conn = ActiveRecord::Base.connection
478       conn.exec_query 'SAVEPOINT save_with_unique_name'
479       begin
480         save!
481         conn.exec_query 'RELEASE SAVEPOINT save_with_unique_name'
482       rescue ActiveRecord::RecordNotUnique => rn
483         raise if max_retries == 0
484         max_retries -= 1
485
486         # Dig into the error to determine if it is specifically calling out a
487         # (owner_uuid, name) uniqueness violation.  In this specific case, and
488         # the client requested a unique name with ensure_unique_name==true,
489         # update the name field and try to save again.  Loop as necessary to
490         # discover a unique name.  It is necessary to handle name choosing at
491         # this level (as opposed to the client) to ensure that record creation
492         # never fails due to a race condition.
493         err = rn.cause
494         raise unless err.is_a?(PG::UniqueViolation)
495
496         # Unfortunately ActiveRecord doesn't abstract out any of the
497         # necessary information to figure out if this the error is actually
498         # the specific case where we want to apply the ensure_unique_name
499         # behavior, so the following code is specialized to Postgres.
500         detail = err.result.error_field(PG::Result::PG_DIAG_MESSAGE_DETAIL)
501         raise unless /^Key \(owner_uuid, name\)=\([a-z0-9]{5}-[a-z0-9]{5}-[a-z0-9]{15}, .*?\) already exists\./.match detail
502
503         conn.exec_query 'ROLLBACK TO SAVEPOINT save_with_unique_name'
504
505         if uuid_was.nil?
506           # new record, the uuid caused a name collision (very
507           # unlikely but possible), so generate new uuid
508           self[:uuid] = nil
509           if self.is_a? Collection
510             # Also needs to be reset
511             self[:current_version_uuid] = nil
512           end
513           # need to adjust the name after the uuid has been generated
514           add_uuid_to_make_unique_name
515         else
516           # existing record, just update the name directly.
517           add_uuid_to_name
518         end
519         retry
520       end
521     end
522   end
523
524   def user_owner_uuid
525     if self.owner_uuid.nil?
526       return current_user.uuid
527     end
528     owner_class = ArvadosModel.resource_class_for_uuid(self.owner_uuid)
529     if owner_class == User
530       self.owner_uuid
531     else
532       owner_class.find_by_uuid(self.owner_uuid).user_owner_uuid
533     end
534   end
535
536   def logged_attributes
537     attributes.except(*Rails.configuration.AuditLogs.UnloggedAttributes.stringify_keys.keys)
538   end
539
540   def self.full_text_searchable_columns
541     self.columns.select do |col|
542       [:string, :text, :jsonb].include?(col.type)
543     end.map(&:name)
544   end
545
546   def self.full_text_coalesce
547     full_text_searchable_columns.collect do |column|
548       is_jsonb = self.columns.select{|x|x.name == column}[0].type == :jsonb
549       cast = (is_jsonb || serialized_attributes[column]) ? '::text' : ''
550       "coalesce(#{column}#{cast},'')"
551     end
552   end
553
554   def self.full_text_trgm
555     "(#{full_text_coalesce.join(" || ' ' || ")})"
556   end
557
558   def self.full_text_tsvector
559     parts = full_text_searchable_columns.collect do |column|
560       is_jsonb = self.columns.select{|x|x.name == column}[0].type == :jsonb
561       cast = (is_jsonb || serialized_attributes[column]) ? '::text' : ''
562       "coalesce(#{column}#{cast},'')"
563     end
564     "to_tsvector('english', substr(#{parts.join(" || ' ' || ")}, 0, 8000))"
565   end
566
567   def self.apply_filters query, filters
568     ft = record_filters filters, self
569     if not ft[:cond_out].any?
570       return query
571     end
572     ft[:joins].each do |t|
573       query = query.joins(t)
574     end
575     query.where('(' + ft[:cond_out].join(') AND (') + ')',
576                           *ft[:param_out])
577   end
578
579   @_add_uuid_to_name = false
580   def add_uuid_to_make_unique_name
581     @_add_uuid_to_name = true
582   end
583
584   def add_uuid_to_name
585     # Incorporate the random part of the UUID into the name.  This
586     # lets us prevent name collision but the part we add to the name
587     # is still somewhat meaningful (instead of generating a second
588     # random meaningless string).
589     #
590     # Because ArvadosModel is an abstract class and assign_uuid is
591     # part of HasUuid (which is included by the other concrete
592     # classes) the assign_uuid hook gets added (and run) after this
593     # one.  So we need to call assign_uuid here to make sure we have a
594     # uuid.
595     assign_uuid
596     self.name = "#{self.name[0..236]} (#{self.uuid[-15..-1]})"
597   end
598
599   protected
600
601   def self.deep_sort_hash(x)
602     if x.is_a? Hash
603       x.sort.collect do |k, v|
604         [k, deep_sort_hash(v)]
605       end.to_h
606     elsif x.is_a? Array
607       x.collect { |v| deep_sort_hash(v) }
608     else
609       x
610     end
611   end
612
613   def ensure_ownership_path_leads_to_user
614     if new_record? or owner_uuid_changed?
615       uuid_in_path = {owner_uuid => true, uuid => true}
616       x = owner_uuid
617       while (owner_class = ArvadosModel::resource_class_for_uuid(x)) != User
618         begin
619           if x == uuid
620             # Test for cycles with the new version, not the DB contents
621             x = owner_uuid
622           elsif !owner_class.respond_to? :find_by_uuid
623             raise ActiveRecord::RecordNotFound.new
624           else
625             x = owner_class.find_by_uuid(x).owner_uuid
626           end
627         rescue ActiveRecord::RecordNotFound => e
628           errors.add :owner_uuid, "is not owned by any user: #{e}"
629           throw(:abort)
630         end
631         if uuid_in_path[x]
632           if x == owner_uuid
633             errors.add :owner_uuid, "would create an ownership cycle"
634           else
635             errors.add :owner_uuid, "has an ownership cycle"
636           end
637           throw(:abort)
638         end
639         uuid_in_path[x] = true
640       end
641     end
642     true
643   end
644
645   def set_default_owner
646     if new_record? and current_user and respond_to? :owner_uuid=
647       self.owner_uuid ||= current_user.uuid
648     end
649   end
650
651   def ensure_owner_uuid_is_permitted
652     raise PermissionDeniedError if !current_user
653
654     if self.owner_uuid.nil?
655       errors.add :owner_uuid, "cannot be nil"
656       raise PermissionDeniedError
657     end
658
659     rsc_class = ArvadosModel::resource_class_for_uuid owner_uuid
660     unless rsc_class == User or rsc_class == Group
661       errors.add :owner_uuid, "must be set to User or Group"
662       raise PermissionDeniedError
663     end
664
665     if new_record? || owner_uuid_changed?
666       # Permission on owner_uuid_was is needed to move an existing
667       # object away from its previous owner (which implies permission
668       # to modify this object itself, so we don't need to check that
669       # separately). Permission on the new owner_uuid is also needed.
670       [['old', owner_uuid_was],
671        ['new', owner_uuid]
672       ].each do |which, check_uuid|
673         if check_uuid.nil?
674           # old_owner_uuid is nil? New record, no need to check.
675         elsif !current_user.can?(write: check_uuid)
676           if FrozenGroup.where(uuid: check_uuid).any?
677             errors.add :owner_uuid, "cannot be set or changed because #{which} owner is frozen"
678           else
679             logger.warn "User #{current_user.uuid} tried to set ownership of #{self.class.to_s} #{self.uuid} but does not have permission to write #{which} owner_uuid #{check_uuid}"
680             errors.add :owner_uuid, "cannot be set or changed without write permission on #{which} owner"
681           end
682           raise PermissionDeniedError
683         elsif rsc_class == Group && Group.find_by_uuid(owner_uuid).group_class != "project"
684           errors.add :owner_uuid, "must be a project"
685           raise PermissionDeniedError
686         end
687       end
688     else
689       # If the object already existed and we're not changing
690       # owner_uuid, we only need write permission on the object
691       # itself. (If we're in the act of unfreezing, we only need
692       # :unfreeze permission, which means "what write permission would
693       # be if target weren't frozen")
694       unless ((respond_to?(:frozen_by_uuid) && frozen_by_uuid_was && !frozen_by_uuid) ?
695                 current_user.can?(unfreeze: uuid) :
696                 current_user.can?(write: uuid))
697         logger.warn "User #{current_user.uuid} tried to modify #{self.class.to_s} #{self.uuid} without write permission"
698         errors.add :uuid, " #{uuid} is not writable by #{current_user.uuid}"
699         raise PermissionDeniedError
700       end
701     end
702
703     true
704   end
705
706   def ensure_permission_to_save
707     unless (new_record? ? permission_to_create : permission_to_update)
708       raise PermissionDeniedError
709     end
710   end
711
712   def permission_to_create
713     return current_user.andand.is_active
714   end
715
716   def permission_to_update
717     if !current_user
718       logger.warn "Anonymous user tried to update #{self.class.to_s} #{self.uuid_was}"
719       return false
720     end
721     if !current_user.is_active
722       logger.warn "Inactive user #{current_user.uuid} tried to update #{self.class.to_s} #{self.uuid_was}"
723       return false
724     end
725     return true if current_user.is_admin
726     if self.uuid_changed?
727       logger.warn "User #{current_user.uuid} tried to change uuid of #{self.class.to_s} #{self.uuid_was} to #{self.uuid}"
728       return false
729     end
730     return true
731   end
732
733   def ensure_permission_to_destroy
734     raise PermissionDeniedError unless permission_to_destroy
735   end
736
737   def permission_to_destroy
738     if [system_user_uuid, system_group_uuid, anonymous_group_uuid,
739         anonymous_user_uuid, public_project_uuid].include? uuid
740       false
741     else
742       permission_to_update
743     end
744   end
745
746   def maybe_update_modified_by_fields
747     update_modified_by_fields if self.changed? or self.new_record?
748     true
749   end
750
751   def update_modified_by_fields
752     current_time = db_current_time
753     self.created_at ||= created_at_was || current_time
754     self.updated_at = current_time
755     self.owner_uuid ||= current_user.uuid if current_user && self.respond_to?(:owner_uuid=)
756     if !anonymous_updater
757       self.modified_by_user_uuid = current_user ? current_user.uuid : nil
758     end
759     if !timeless_updater
760       self.modified_at = current_time
761     end
762     self.modified_by_client_uuid = current_api_client ? current_api_client.uuid : nil
763     true
764   end
765
766   def self.has_nonstring_keys? x
767     if x.is_a? Hash
768       x.each do |k,v|
769         return true if !(k.is_a?(String) || k.is_a?(Symbol)) || has_nonstring_keys?(v)
770       end
771     elsif x.is_a? Array
772       x.each do |v|
773         return true if has_nonstring_keys?(v)
774       end
775     end
776     false
777   end
778
779   def self.where_serialized(colname, value, md5: false, multivalue: false)
780     colsql = colname.to_s
781     if md5
782       colsql = "md5(#{colsql})"
783     end
784     if value.empty?
785       # rails4 stores as null, rails3 stored as serialized [] or {}
786       sql = "#{colsql} is null or #{colsql} IN (?)"
787       sorted = value
788     else
789       sql = "#{colsql} IN (?)"
790       sorted = deep_sort_hash(value)
791     end
792     params = []
793     if multivalue
794       sorted.each do |v|
795         params << v.to_yaml
796         params << SafeJSON.dump(v)
797       end
798     else
799       params << sorted.to_yaml
800       params << SafeJSON.dump(sorted)
801     end
802     if md5
803       params = params.map { |x| Digest::MD5.hexdigest(x) }
804     end
805     where(sql, params)
806   end
807
808   Serializer = {
809     Hash => HashSerializer,
810     Array => ArraySerializer,
811   }
812
813   def self.serialize(colname, type)
814     coder = Serializer[type]
815     @serialized_attributes ||= {}
816     @serialized_attributes[colname.to_s] = coder
817     super(colname, coder)
818   end
819
820   def self.serialized_attributes
821     @serialized_attributes ||= {}
822   end
823
824   def serialized_attributes
825     self.class.serialized_attributes
826   end
827
828   def foreign_key_attributes
829     attributes.keys.select { |a| a.match(/_uuid$/) }
830   end
831
832   def skip_uuid_read_permission_check
833     %w(modified_by_client_uuid)
834   end
835
836   def skip_uuid_existence_check
837     []
838   end
839
840   def normalize_collection_uuids
841     foreign_key_attributes.each do |attr|
842       attr_value = send attr
843       if attr_value.is_a? String and
844           attr_value.match(/^[0-9a-f]{32,}(\+[@\w]+)*$/)
845         begin
846           send "#{attr}=", Collection.normalize_uuid(attr_value)
847         rescue
848           # TODO: abort instead of silently accepting unnormalizable value?
849         end
850       end
851     end
852   end
853
854   @@prefixes_hash = nil
855   def self.uuid_prefixes
856     unless @@prefixes_hash
857       @@prefixes_hash = {}
858       Rails.application.eager_load!
859       ActiveRecord::Base.descendants.reject(&:abstract_class?).each do |k|
860         if k.respond_to?(:uuid_prefix)
861           @@prefixes_hash[k.uuid_prefix] = k
862         end
863       end
864     end
865     @@prefixes_hash
866   end
867
868   def self.uuid_like_pattern
869     "#{Rails.configuration.ClusterID}-#{uuid_prefix}-_______________"
870   end
871
872   def self.uuid_regex
873     %r/[a-z0-9]{5}-#{uuid_prefix}-[a-z0-9]{15}/
874   end
875
876   def check_readable_uuid attr, attr_value
877     return if attr_value.nil?
878     if (r = ArvadosModel::resource_class_for_uuid attr_value)
879       unless skip_uuid_read_permission_check.include? attr
880         r = r.readable_by(current_user)
881       end
882       if r.where(uuid: attr_value).count == 0
883         errors.add(attr, "'#{attr_value}' not found")
884       end
885     else
886       # Not a valid uuid or PDH, but that (currently) is not an error.
887     end
888   end
889
890   def ensure_valid_uuids
891     specials = [system_user_uuid]
892
893     foreign_key_attributes.each do |attr|
894       if new_record? or send (attr + "_changed?")
895         next if skip_uuid_existence_check.include? attr
896         attr_value = send attr
897         next if specials.include? attr_value
898         check_readable_uuid attr, attr_value
899       end
900     end
901   end
902
903   def ensure_filesystem_compatible_name
904     if name == "." || name == ".."
905       errors.add(:name, "cannot be '.' or '..'")
906     elsif Rails.configuration.Collections.ForwardSlashNameSubstitution == "" && !name.nil? && name.index('/')
907       errors.add(:name, "cannot contain a '/' character")
908     end
909   end
910
911   class Email
912     def self.kind
913       "email"
914     end
915
916     def kind
917       self.class.kind
918     end
919
920     def self.readable_by (*u)
921       self
922     end
923
924     def self.where (u)
925       [{:uuid => u[:uuid]}]
926     end
927   end
928
929   def self.resource_class_for_uuid(uuid)
930     if uuid.is_a? ArvadosModel
931       return uuid.class
932     end
933     unless uuid.is_a? String
934       return nil
935     end
936
937     uuid.match HasUuid::UUID_REGEX do |re|
938       return uuid_prefixes[re[1]] if uuid_prefixes[re[1]]
939     end
940
941     if uuid.match(/.+@.+/)
942       return Email
943     end
944
945     nil
946   end
947
948   # Fill in implied zero/false values in database records that were
949   # created before #17014 made them explicit, and reset the Rails
950   # "changed" state so the record doesn't appear to have been modified
951   # after loading.
952   #
953   # Invoked by Container and ContainerRequest models as an after_find
954   # hook.
955   def fill_container_defaults_after_find
956     fill_container_defaults
957     clear_changes_information
958   end
959
960   # Fill in implied zero/false values. Invoked by ContainerRequest as
961   # a before_validation hook in order to (a) ensure every key has a
962   # value in the updated database record and (b) ensure the attribute
963   # whitelist doesn't reject a change from an explicit zero/false
964   # value in the database to an implicit zero/false value in an update
965   # request.
966   def fill_container_defaults
967     # Make sure this is correctly sorted by key, because we merge in
968     # whatever is in the database on top of it, this will be the order
969     # that gets used downstream rather than the order the keys appear
970     # in the database.
971     self.runtime_constraints = {
972       'API' => false,
973       'cuda' => {
974         'device_count' => 0,
975         'driver_version' => '',
976         'hardware_capability' => '',
977       },
978       'keep_cache_disk' => 0,
979       'keep_cache_ram' => 0,
980       'ram' => 0,
981       'vcpus' => 0,
982     }.merge(attributes['runtime_constraints'] || {})
983     self.scheduling_parameters = {
984       'max_run_time' => 0,
985       'partitions' => [],
986       'preemptible' => false,
987       'supervisor' => false,
988     }.merge(attributes['scheduling_parameters'] || {})
989   end
990
991   # ArvadosModel.find_by_uuid needs extra magic to allow it to return
992   # an object in any class.
993   def self.find_by_uuid uuid
994     if self == ArvadosModel
995       # If called directly as ArvadosModel.find_by_uuid rather than via subclass,
996       # delegate to the appropriate subclass based on the given uuid.
997       self.resource_class_for_uuid(uuid).find_by_uuid(uuid)
998     else
999       super
1000     end
1001   end
1002
1003   def is_audit_logging_enabled?
1004     return !(Rails.configuration.AuditLogs.MaxAge.to_i == 0 &&
1005              Rails.configuration.AuditLogs.MaxDeleteBatch.to_i > 0)
1006   end
1007
1008   def schedule_restoring_changes
1009     # This will be checked at log_start_state, to reset any (virtual) changes
1010     # produced by the act of reading a serialized attribute.
1011     @fresh_from_database = true
1012   end
1013
1014   def log_start_state
1015     if is_audit_logging_enabled?
1016       @old_attributes = Marshal.load(Marshal.dump(attributes))
1017       @old_logged_attributes = Marshal.load(Marshal.dump(logged_attributes))
1018       if @fresh_from_database
1019         # This instance was created from reading a database record. Attributes
1020         # haven't been changed, but those serialized attributes will be reported
1021         # as unpersisted, so we restore them to avoid issues with lock!() and
1022         # with_lock().
1023         restore_attributes
1024         @fresh_from_database = nil
1025       end
1026     end
1027   end
1028
1029   def log_change(event_type)
1030     if is_audit_logging_enabled?
1031       log = Log.new(event_type: event_type).fill_object(self)
1032       yield log
1033       log.save!
1034       log_start_state
1035     end
1036   end
1037
1038   def log_create
1039     if is_audit_logging_enabled?
1040       log_change('create') do |log|
1041         log.fill_properties('old', nil, nil)
1042         log.update_to self
1043       end
1044     end
1045   end
1046
1047   def log_update
1048     if is_audit_logging_enabled?
1049       log_change('update') do |log|
1050         log.fill_properties('old', etag(@old_attributes), @old_logged_attributes)
1051         log.update_to self
1052       end
1053     end
1054   end
1055
1056   def log_destroy
1057     if is_audit_logging_enabled?
1058       log_change('delete') do |log|
1059         log.fill_properties('old', etag(@old_attributes), @old_logged_attributes)
1060         log.update_to nil
1061       end
1062     end
1063   end
1064 end