17417: Merge branch 'main' into 17417-add-arm64
[arvados.git] / services / api / app / models / arvados_model.rb
1 # Copyright (C) The Arvados Authors. All rights reserved.
2 #
3 # SPDX-License-Identifier: AGPL-3.0
4
5 require 'arvados_model_updates'
6 require 'has_uuid'
7 require 'record_filters'
8 require 'serializers'
9 require 'request_error'
10
11 class ArvadosModel < ApplicationRecord
12   self.abstract_class = true
13
14   include ArvadosModelUpdates
15   include CurrentApiClient      # current_user, current_api_client, etc.
16   include DbCurrentTime
17   extend RecordFilters
18
19   after_find :schedule_restoring_changes
20   after_initialize :log_start_state
21   before_save :ensure_permission_to_save
22   before_save :ensure_owner_uuid_is_permitted
23   before_save :ensure_ownership_path_leads_to_user
24   before_destroy :ensure_owner_uuid_is_permitted
25   before_destroy :ensure_permission_to_destroy
26   before_create :update_modified_by_fields
27   before_update :maybe_update_modified_by_fields
28   after_create :log_create
29   after_update :log_update
30   after_destroy :log_destroy
31   before_validation :normalize_collection_uuids
32   before_validation :set_default_owner
33   validate :ensure_valid_uuids
34
35   # Note: This only returns permission links. It does not account for
36   # permissions obtained via user.is_admin or
37   # user.uuid==object.owner_uuid.
38   has_many(:permissions,
39            ->{where(link_class: 'permission')},
40            foreign_key: :head_uuid,
41            class_name: 'Link',
42            primary_key: :uuid)
43
44   # If async is true at create or update, permission graph
45   # update is deferred allowing making multiple calls without the performance
46   # penalty.
47   attr_accessor :async_permissions_update
48
49   # Ignore listed attributes on mass assignments
50   def self.protected_attributes
51     []
52   end
53
54   class PermissionDeniedError < RequestError
55     def http_status
56       403
57     end
58   end
59
60   class AlreadyLockedError < RequestError
61     def http_status
62       422
63     end
64   end
65
66   class LockFailedError < RequestError
67     def http_status
68       422
69     end
70   end
71
72   class InvalidStateTransitionError < RequestError
73     def http_status
74       422
75     end
76   end
77
78   class UnauthorizedError < RequestError
79     def http_status
80       401
81     end
82   end
83
84   class UnresolvableContainerError < RequestError
85     def http_status
86       422
87     end
88   end
89
90   def self.kind_class(kind)
91     kind.match(/^arvados\#(.+)$/)[1].classify.safe_constantize rescue nil
92   end
93
94   def href
95     "#{current_api_base}/#{self.class.to_s.pluralize.underscore}/#{self.uuid}"
96   end
97
98   def self.permit_attribute_params raw_params
99     # strong_parameters does not provide security: permissions are
100     # implemented with before_save hooks.
101     #
102     # The following permit! is necessary even with
103     # "ActionController::Parameters.permit_all_parameters = true",
104     # because permit_all does not permit nested attributes.
105     raw_params ||= {}
106
107     if raw_params
108       raw_params = raw_params.to_hash
109       raw_params.delete_if { |k, _| self.protected_attributes.include? k }
110       serialized_attributes.each do |colname, coder|
111         param = raw_params[colname.to_sym]
112         if param.nil?
113           # ok
114         elsif !param.is_a?(coder.object_class)
115           raise ArgumentError.new("#{colname} parameter must be #{coder.object_class}, not #{param.class}")
116         elsif has_nonstring_keys?(param)
117           raise ArgumentError.new("#{colname} parameter cannot have non-string hash keys")
118         end
119       end
120       # Check JSONB columns that aren't listed on serialized_attributes
121       columns.select{|c| c.type == :jsonb}.collect{|j| j.name}.each do |colname|
122         if serialized_attributes.include? colname || raw_params[colname.to_sym].nil?
123           next
124         end
125         if has_nonstring_keys?(raw_params[colname.to_sym])
126           raise ArgumentError.new("#{colname} parameter cannot have non-string hash keys")
127         end
128       end
129     end
130     ActionController::Parameters.new(raw_params).permit!
131   end
132
133   def initialize raw_params={}, *args
134     super(self.class.permit_attribute_params(raw_params), *args)
135   end
136
137   # Reload "old attributes" for logging, too.
138   def reload(*args)
139     super
140     log_start_state
141     self
142   end
143
144   def self.create raw_params={}, *args
145     super(permit_attribute_params(raw_params), *args)
146   end
147
148   def update_attributes raw_params={}, *args
149     super(self.class.permit_attribute_params(raw_params), *args)
150   end
151
152   def self.selectable_attributes(template=:user)
153     # Return an array of attribute name strings that can be selected
154     # in the given template.
155     api_accessible_attributes(template).map { |attr_spec| attr_spec.first.to_s }
156   end
157
158   def self.searchable_columns operator
159     textonly_operator = !operator.match(/[<=>]/)
160     self.columns.select do |col|
161       case col.type
162       when :string, :text
163         true
164       when :datetime, :integer, :boolean
165         !textonly_operator
166       else
167         false
168       end
169     end.map(&:name)
170   end
171
172   def self.attribute_column attr
173     self.columns.select { |col| col.name == attr.to_s }.first
174   end
175
176   def self.attributes_required_columns
177     # This method returns a hash.  Each key is the name of an API attribute,
178     # and it's mapped to a list of database columns that must be fetched
179     # to generate that attribute.
180     # This implementation generates a simple map of attributes to
181     # matching column names.  Subclasses can override this method
182     # to specify that method-backed API attributes need to fetch
183     # specific columns from the database.
184     all_columns = columns.map(&:name)
185     api_column_map = Hash.new { |hash, key| hash[key] = [] }
186     methods.grep(/^api_accessible_\w+$/).each do |method_name|
187       next if method_name == :api_accessible_attributes
188       send(method_name).each_pair do |api_attr_name, col_name|
189         col_name = col_name.to_s
190         if all_columns.include?(col_name)
191           api_column_map[api_attr_name.to_s] |= [col_name]
192         end
193       end
194     end
195     api_column_map
196   end
197
198   def self.ignored_select_attributes
199     ["href", "kind", "etag"]
200   end
201
202   def self.columns_for_attributes(select_attributes)
203     if select_attributes.empty?
204       raise ArgumentError.new("Attribute selection list cannot be empty")
205     end
206     api_column_map = attributes_required_columns
207     invalid_attrs = []
208     select_attributes.each do |s|
209       next if ignored_select_attributes.include? s
210       if not s.is_a? String or not api_column_map.include? s
211         invalid_attrs << s
212       end
213     end
214     if not invalid_attrs.empty?
215       raise ArgumentError.new("Invalid attribute(s): #{invalid_attrs.inspect}")
216     end
217     # Given an array of attribute names to select, return an array of column
218     # names that must be fetched from the database to satisfy the request.
219     select_attributes.flat_map { |attr| api_column_map[attr] }.uniq
220   end
221
222   def self.default_orders
223     ["#{table_name}.modified_at desc", "#{table_name}.uuid"]
224   end
225
226   def self.unique_columns
227     ["id", "uuid"]
228   end
229
230   def self.limit_index_columns_read
231     # This method returns a list of column names.
232     # If an index request reads that column from the database,
233     # APIs that return lists will only fetch objects until reaching
234     # max_index_database_read bytes of data from those columns.
235     []
236   end
237
238   # If current user can manage the object, return an array of uuids of
239   # users and groups that have permission to write the object. The
240   # first two elements are always [self.owner_uuid, current user's
241   # uuid].
242   #
243   # If current user can write but not manage the object, return
244   # [self.owner_uuid, current user's uuid].
245   #
246   # If current user cannot write this object, just return
247   # [self.owner_uuid].
248   def writable_by
249     return [owner_uuid] if not current_user
250     unless (owner_uuid == current_user.uuid or
251             current_user.is_admin or
252             (current_user.groups_i_can(:manage) & [uuid, owner_uuid]).any?)
253       if ((current_user.groups_i_can(:write) + [current_user.uuid]) &
254           [uuid, owner_uuid]).any?
255         return [owner_uuid, current_user.uuid]
256       else
257         return [owner_uuid]
258       end
259     end
260     [owner_uuid, current_user.uuid] + permissions.collect do |p|
261       if ['can_write', 'can_manage'].index p.name
262         p.tail_uuid
263       end
264     end.compact.uniq
265   end
266
267   # Return a query with read permissions restricted to the union of the
268   # permissions of the members of users_list, i.e. if something is readable by
269   # any user in users_list, it will be readable in the query returned by this
270   # function.
271   def self.readable_by(*users_list)
272     # Get rid of troublesome nils
273     users_list.compact!
274
275     # Load optional keyword arguments, if they exist.
276     if users_list.last.is_a? Hash
277       kwargs = users_list.pop
278     else
279       kwargs = {}
280     end
281
282     # Collect the UUIDs of the authorized users.
283     sql_table = kwargs.fetch(:table_name, table_name)
284     include_trash = kwargs.fetch(:include_trash, false)
285     include_old_versions = kwargs.fetch(:include_old_versions, false)
286
287     sql_conds = nil
288     user_uuids = users_list.map { |u| u.uuid }
289     all_user_uuids = []
290
291     # For details on how the trashed_groups table is constructed, see
292     # see db/migrate/20200501150153_permission_table.rb
293
294     exclude_trashed_records = ""
295     if !include_trash and (sql_table == "groups" or sql_table == "collections") then
296       # Only include records that are not trashed
297       exclude_trashed_records = "AND (#{sql_table}.trash_at is NULL or #{sql_table}.trash_at > statement_timestamp())"
298     end
299
300     trashed_check = ""
301     if !include_trash && sql_table != "api_client_authorizations"
302       trashed_check = "#{sql_table}.owner_uuid NOT IN (SELECT group_uuid FROM #{TRASHED_GROUPS} " +
303                       "where trash_at <= statement_timestamp()) #{exclude_trashed_records}"
304     end
305
306     if users_list.select { |u| u.is_admin }.any?
307       # Admin skips most permission checks, but still want to filter on trashed items.
308       if !include_trash && sql_table != "api_client_authorizations"
309         # Only include records where the owner is not trashed
310         sql_conds = trashed_check
311       end
312     else
313       # The core of the permission check is a join against the
314       # materialized_permissions table to determine if the user has at
315       # least read permission to either the object itself or its
316       # direct owner (if traverse_owned is true).  See
317       # db/migrate/20200501150153_permission_table.rb for details on
318       # how the permissions are computed.
319
320       # A user can have can_manage access to another user, this grants
321       # full access to all that user's stuff.  To implement that we
322       # need to include those other users in the permission query.
323
324       # This was previously implemented by embedding the subquery
325       # directly into the query, but it was discovered later that this
326       # causes the Postgres query planner to do silly things because
327       # the query heuristics assumed the subquery would have a lot
328       # more rows that it does, and choose a bad merge strategy.  By
329       # doing the query here and embedding the result as a constant,
330       # Postgres also knows exactly how many items there are and can
331       # choose the right query strategy.
332       #
333       # (note: you could also do this with a temporary table, but that
334       # would require all every request be wrapped in a transaction,
335       # which is not currently the case).
336
337       all_user_uuids = ActiveRecord::Base.connection.exec_query %{
338 #{USER_UUIDS_SUBQUERY_TEMPLATE % {user: "'#{user_uuids.join "', '"}'", perm_level: 1}}
339 },
340                                              'readable_by.user_uuids'
341
342       user_uuids_subquery = ":user_uuids"
343
344       # Note: it is possible to combine the direct_check and
345       # owner_check into a single IN (SELECT) clause, however it turns
346       # out query optimizer doesn't like it and forces a sequential
347       # table scan.  Constructing the query with separate IN (SELECT)
348       # clauses enables it to use the index.
349       #
350       # see issue 13208 for details.
351
352       # Match a direct read permission link from the user to the record uuid
353       direct_check = "#{sql_table}.uuid IN (SELECT target_uuid FROM #{PERMISSION_VIEW} "+
354                      "WHERE user_uuid IN (#{user_uuids_subquery}) AND perm_level >= 1)"
355
356       # Match a read permission for the user to the record's
357       # owner_uuid.  This is so we can have a permissions table that
358       # mostly consists of users and groups (projects are a type of
359       # group) and not have to compute and list user permission to
360       # every single object in the system.
361       #
362       # Don't do this for API keys (special behavior) or groups
363       # (already covered by direct_check).
364       #
365       # The traverse_owned flag indicates whether the permission to
366       # read an object also implies transitive permission to read
367       # things the object owns.  The situation where this is important
368       # are determining if we can read an object owned by another
369       # user.  This makes it possible to have permission to read the
370       # user record without granting permission to read things the
371       # other user owns.
372       owner_check = ""
373       if sql_table != "api_client_authorizations" and sql_table != "groups" then
374         owner_check = "#{sql_table}.owner_uuid IN (SELECT target_uuid FROM #{PERMISSION_VIEW} "+
375                       "WHERE user_uuid IN (#{user_uuids_subquery}) AND perm_level >= 1 AND traverse_owned) "
376
377         # We want to do owner_check before direct_check in the OR
378         # clause.  The order of the OR clause isn't supposed to
379         # matter, but in practice, it does -- apparently in the
380         # absence of other hints, it uses the ordering from the query.
381         # For certain types of queries (like filtering on owner_uuid),
382         # every item will match the owner_check clause, so then
383         # Postgres will optimize out the direct_check entirely.
384         direct_check = " OR " + direct_check
385       end
386
387       if Rails.configuration.Users.RoleGroupsVisibleToAll &&
388          sql_table == "groups" &&
389          users_list.select { |u| u.is_active }.any?
390         # All role groups are readable (but we still need the other
391         # direct_check clauses to handle non-role groups).
392         direct_check += " OR #{sql_table}.group_class = 'role'"
393       end
394
395       links_cond = ""
396       if sql_table == "links"
397         # 1) Match permission links incoming or outgoing on the
398         # user, i.e. granting permission on the user, or granting
399         # permission to the user.
400         #
401         # 2) Match permission links which grant permission on an
402         # object that this user can_manage.
403         #
404         links_cond = "OR (#{sql_table}.link_class IN (:permission_link_classes) AND "+
405                      "   ((#{sql_table}.head_uuid IN (#{user_uuids_subquery}) OR #{sql_table}.tail_uuid IN (#{user_uuids_subquery})) OR " +
406                      "    #{sql_table}.head_uuid IN (SELECT target_uuid FROM #{PERMISSION_VIEW} "+
407                      "    WHERE user_uuid IN (#{user_uuids_subquery}) AND perm_level >= 3))) "
408       end
409
410       sql_conds = "(#{owner_check} #{direct_check} #{links_cond}) #{trashed_check.empty? ? "" : "AND"} #{trashed_check}"
411
412     end
413
414     if !include_old_versions && sql_table == "collections"
415       exclude_old_versions = "#{sql_table}.uuid = #{sql_table}.current_version_uuid"
416       if sql_conds.nil?
417         sql_conds = exclude_old_versions
418       else
419         sql_conds += " AND #{exclude_old_versions}"
420       end
421     end
422
423     self.where(sql_conds,
424                user_uuids: all_user_uuids.collect{|c| c["target_uuid"]},
425                permission_link_classes: ['permission'])
426   end
427
428   def save_with_unique_name!
429     uuid_was = uuid
430     name_was = name
431     max_retries = 2
432     transaction do
433       conn = ActiveRecord::Base.connection
434       conn.exec_query 'SAVEPOINT save_with_unique_name'
435       begin
436         save!
437       rescue ActiveRecord::RecordNotUnique => rn
438         raise if max_retries == 0
439         max_retries -= 1
440
441         conn.exec_query 'ROLLBACK TO SAVEPOINT save_with_unique_name'
442
443         # Dig into the error to determine if it is specifically calling out a
444         # (owner_uuid, name) uniqueness violation.  In this specific case, and
445         # the client requested a unique name with ensure_unique_name==true,
446         # update the name field and try to save again.  Loop as necessary to
447         # discover a unique name.  It is necessary to handle name choosing at
448         # this level (as opposed to the client) to ensure that record creation
449         # never fails due to a race condition.
450         err = rn.cause
451         raise unless err.is_a?(PG::UniqueViolation)
452
453         # Unfortunately ActiveRecord doesn't abstract out any of the
454         # necessary information to figure out if this the error is actually
455         # the specific case where we want to apply the ensure_unique_name
456         # behavior, so the following code is specialized to Postgres.
457         detail = err.result.error_field(PG::Result::PG_DIAG_MESSAGE_DETAIL)
458         raise unless /^Key \(owner_uuid, name\)=\([a-z0-9]{5}-[a-z0-9]{5}-[a-z0-9]{15}, .*?\) already exists\./.match detail
459
460         new_name = "#{name_was} (#{db_current_time.utc.iso8601(3)})"
461         if new_name == name
462           # If the database is fast enough to do two attempts in the
463           # same millisecond, we need to wait to ensure we try a
464           # different timestamp on each attempt.
465           sleep 0.002
466           new_name = "#{name_was} (#{db_current_time.utc.iso8601(3)})"
467         end
468
469         self[:name] = new_name
470         if uuid_was.nil? && !uuid.nil?
471           self[:uuid] = nil
472           if self.is_a? Collection
473             # Reset so that is assigned to the new UUID
474             self[:current_version_uuid] = nil
475           end
476         end
477         conn.exec_query 'SAVEPOINT save_with_unique_name'
478         retry
479       ensure
480         conn.exec_query 'RELEASE SAVEPOINT save_with_unique_name'
481       end
482     end
483   end
484
485   def user_owner_uuid
486     if self.owner_uuid.nil?
487       return current_user.uuid
488     end
489     owner_class = ArvadosModel.resource_class_for_uuid(self.owner_uuid)
490     if owner_class == User
491       self.owner_uuid
492     else
493       owner_class.find_by_uuid(self.owner_uuid).user_owner_uuid
494     end
495   end
496
497   def logged_attributes
498     attributes.except(*Rails.configuration.AuditLogs.UnloggedAttributes.stringify_keys.keys)
499   end
500
501   def self.full_text_searchable_columns
502     self.columns.select do |col|
503       [:string, :text, :jsonb].include?(col.type)
504     end.map(&:name)
505   end
506
507   def self.full_text_coalesce
508     full_text_searchable_columns.collect do |column|
509       is_jsonb = self.columns.select{|x|x.name == column}[0].type == :jsonb
510       cast = (is_jsonb || serialized_attributes[column]) ? '::text' : ''
511       "coalesce(#{column}#{cast},'')"
512     end
513   end
514
515   def self.full_text_trgm
516     "(#{full_text_coalesce.join(" || ' ' || ")})"
517   end
518
519   def self.full_text_tsvector
520     parts = full_text_searchable_columns.collect do |column|
521       is_jsonb = self.columns.select{|x|x.name == column}[0].type == :jsonb
522       cast = (is_jsonb || serialized_attributes[column]) ? '::text' : ''
523       "coalesce(#{column}#{cast},'')"
524     end
525     "to_tsvector('english', substr(#{parts.join(" || ' ' || ")}, 0, 8000))"
526   end
527
528   def self.apply_filters query, filters
529     ft = record_filters filters, self
530     if not ft[:cond_out].any?
531       return query
532     end
533     ft[:joins].each do |t|
534       query = query.joins(t)
535     end
536     query.where('(' + ft[:cond_out].join(') AND (') + ')',
537                           *ft[:param_out])
538   end
539
540   protected
541
542   def self.deep_sort_hash(x)
543     if x.is_a? Hash
544       x.sort.collect do |k, v|
545         [k, deep_sort_hash(v)]
546       end.to_h
547     elsif x.is_a? Array
548       x.collect { |v| deep_sort_hash(v) }
549     else
550       x
551     end
552   end
553
554   def ensure_ownership_path_leads_to_user
555     if new_record? or owner_uuid_changed?
556       uuid_in_path = {owner_uuid => true, uuid => true}
557       x = owner_uuid
558       while (owner_class = ArvadosModel::resource_class_for_uuid(x)) != User
559         begin
560           if x == uuid
561             # Test for cycles with the new version, not the DB contents
562             x = owner_uuid
563           elsif !owner_class.respond_to? :find_by_uuid
564             raise ActiveRecord::RecordNotFound.new
565           else
566             x = owner_class.find_by_uuid(x).owner_uuid
567           end
568         rescue ActiveRecord::RecordNotFound => e
569           errors.add :owner_uuid, "is not owned by any user: #{e}"
570           throw(:abort)
571         end
572         if uuid_in_path[x]
573           if x == owner_uuid
574             errors.add :owner_uuid, "would create an ownership cycle"
575           else
576             errors.add :owner_uuid, "has an ownership cycle"
577           end
578           throw(:abort)
579         end
580         uuid_in_path[x] = true
581       end
582     end
583     true
584   end
585
586   def set_default_owner
587     if new_record? and current_user and respond_to? :owner_uuid=
588       self.owner_uuid ||= current_user.uuid
589     end
590   end
591
592   def ensure_owner_uuid_is_permitted
593     raise PermissionDeniedError if !current_user
594
595     if self.owner_uuid.nil?
596       errors.add :owner_uuid, "cannot be nil"
597       raise PermissionDeniedError
598     end
599
600     rsc_class = ArvadosModel::resource_class_for_uuid owner_uuid
601     unless rsc_class == User or rsc_class == Group
602       errors.add :owner_uuid, "must be set to User or Group"
603       raise PermissionDeniedError
604     end
605
606     if new_record? || owner_uuid_changed?
607       # Permission on owner_uuid_was is needed to move an existing
608       # object away from its previous owner (which implies permission
609       # to modify this object itself, so we don't need to check that
610       # separately). Permission on the new owner_uuid is also needed.
611       [['old', owner_uuid_was],
612        ['new', owner_uuid]
613       ].each do |which, check_uuid|
614         if check_uuid.nil?
615           # old_owner_uuid is nil? New record, no need to check.
616         elsif !current_user.can?(write: check_uuid)
617           logger.warn "User #{current_user.uuid} tried to set ownership of #{self.class.to_s} #{self.uuid} but does not have permission to write #{which} owner_uuid #{check_uuid}"
618           errors.add :owner_uuid, "cannot be set or changed without write permission on #{which} owner"
619           raise PermissionDeniedError
620         elsif rsc_class == Group && Group.find_by_uuid(owner_uuid).group_class != "project"
621           errors.add :owner_uuid, "must be a project"
622           raise PermissionDeniedError
623         end
624       end
625     else
626       # If the object already existed and we're not changing
627       # owner_uuid, we only need write permission on the object
628       # itself.
629       if !current_user.can?(write: self.uuid)
630         logger.warn "User #{current_user.uuid} tried to modify #{self.class.to_s} #{self.uuid} without write permission"
631         errors.add :uuid, " #{uuid} is not writable by #{current_user.uuid}"
632         raise PermissionDeniedError
633       end
634     end
635
636     true
637   end
638
639   def ensure_permission_to_save
640     unless (new_record? ? permission_to_create : permission_to_update)
641       raise PermissionDeniedError
642     end
643   end
644
645   def permission_to_create
646     current_user.andand.is_active
647   end
648
649   def permission_to_update
650     if !current_user
651       logger.warn "Anonymous user tried to update #{self.class.to_s} #{self.uuid_was}"
652       return false
653     end
654     if !current_user.is_active
655       logger.warn "Inactive user #{current_user.uuid} tried to update #{self.class.to_s} #{self.uuid_was}"
656       return false
657     end
658     return true if current_user.is_admin
659     if self.uuid_changed?
660       logger.warn "User #{current_user.uuid} tried to change uuid of #{self.class.to_s} #{self.uuid_was} to #{self.uuid}"
661       return false
662     end
663     return true
664   end
665
666   def ensure_permission_to_destroy
667     raise PermissionDeniedError unless permission_to_destroy
668   end
669
670   def permission_to_destroy
671     if [system_user_uuid, system_group_uuid, anonymous_group_uuid,
672         anonymous_user_uuid, public_project_uuid].include? uuid
673       false
674     else
675       permission_to_update
676     end
677   end
678
679   def maybe_update_modified_by_fields
680     update_modified_by_fields if self.changed? or self.new_record?
681     true
682   end
683
684   def update_modified_by_fields
685     current_time = db_current_time
686     self.created_at ||= created_at_was || current_time
687     self.updated_at = current_time
688     self.owner_uuid ||= current_default_owner if self.respond_to? :owner_uuid=
689     if !anonymous_updater
690       self.modified_by_user_uuid = current_user ? current_user.uuid : nil
691     end
692     if !timeless_updater
693       self.modified_at = current_time
694     end
695     self.modified_by_client_uuid = current_api_client ? current_api_client.uuid : nil
696     true
697   end
698
699   def self.has_nonstring_keys? x
700     if x.is_a? Hash
701       x.each do |k,v|
702         return true if !(k.is_a?(String) || k.is_a?(Symbol)) || has_nonstring_keys?(v)
703       end
704     elsif x.is_a? Array
705       x.each do |v|
706         return true if has_nonstring_keys?(v)
707       end
708     end
709     false
710   end
711
712   def self.where_serialized(colname, value, md5: false)
713     colsql = colname.to_s
714     if md5
715       colsql = "md5(#{colsql})"
716     end
717     if value.empty?
718       # rails4 stores as null, rails3 stored as serialized [] or {}
719       sql = "#{colsql} is null or #{colsql} IN (?)"
720       sorted = value
721     else
722       sql = "#{colsql} IN (?)"
723       sorted = deep_sort_hash(value)
724     end
725     params = [sorted.to_yaml, SafeJSON.dump(sorted)]
726     if md5
727       params = params.map { |x| Digest::MD5.hexdigest(x) }
728     end
729     where(sql, params)
730   end
731
732   Serializer = {
733     Hash => HashSerializer,
734     Array => ArraySerializer,
735   }
736
737   def self.serialize(colname, type)
738     coder = Serializer[type]
739     @serialized_attributes ||= {}
740     @serialized_attributes[colname.to_s] = coder
741     super(colname, coder)
742   end
743
744   def self.serialized_attributes
745     @serialized_attributes ||= {}
746   end
747
748   def serialized_attributes
749     self.class.serialized_attributes
750   end
751
752   def foreign_key_attributes
753     attributes.keys.select { |a| a.match(/_uuid$/) }
754   end
755
756   def skip_uuid_read_permission_check
757     %w(modified_by_client_uuid)
758   end
759
760   def skip_uuid_existence_check
761     []
762   end
763
764   def normalize_collection_uuids
765     foreign_key_attributes.each do |attr|
766       attr_value = send attr
767       if attr_value.is_a? String and
768           attr_value.match(/^[0-9a-f]{32,}(\+[@\w]+)*$/)
769         begin
770           send "#{attr}=", Collection.normalize_uuid(attr_value)
771         rescue
772           # TODO: abort instead of silently accepting unnormalizable value?
773         end
774       end
775     end
776   end
777
778   @@prefixes_hash = nil
779   def self.uuid_prefixes
780     unless @@prefixes_hash
781       @@prefixes_hash = {}
782       Rails.application.eager_load!
783       ActiveRecord::Base.descendants.reject(&:abstract_class?).each do |k|
784         if k.respond_to?(:uuid_prefix)
785           @@prefixes_hash[k.uuid_prefix] = k
786         end
787       end
788     end
789     @@prefixes_hash
790   end
791
792   def self.uuid_like_pattern
793     "#{Rails.configuration.ClusterID}-#{uuid_prefix}-_______________"
794   end
795
796   def self.uuid_regex
797     %r/[a-z0-9]{5}-#{uuid_prefix}-[a-z0-9]{15}/
798   end
799
800   def check_readable_uuid attr, attr_value
801     return if attr_value.nil?
802     if (r = ArvadosModel::resource_class_for_uuid attr_value)
803       unless skip_uuid_read_permission_check.include? attr
804         r = r.readable_by(current_user)
805       end
806       if r.where(uuid: attr_value).count == 0
807         errors.add(attr, "'#{attr_value}' not found")
808       end
809     else
810       # Not a valid uuid or PDH, but that (currently) is not an error.
811     end
812   end
813
814   def ensure_valid_uuids
815     specials = [system_user_uuid]
816
817     foreign_key_attributes.each do |attr|
818       if new_record? or send (attr + "_changed?")
819         next if skip_uuid_existence_check.include? attr
820         attr_value = send attr
821         next if specials.include? attr_value
822         check_readable_uuid attr, attr_value
823       end
824     end
825   end
826
827   def ensure_filesystem_compatible_name
828     if name == "." || name == ".."
829       errors.add(:name, "cannot be '.' or '..'")
830     elsif Rails.configuration.Collections.ForwardSlashNameSubstitution == "" && !name.nil? && name.index('/')
831       errors.add(:name, "cannot contain a '/' character")
832     end
833   end
834
835   class Email
836     def self.kind
837       "email"
838     end
839
840     def kind
841       self.class.kind
842     end
843
844     def self.readable_by (*u)
845       self
846     end
847
848     def self.where (u)
849       [{:uuid => u[:uuid]}]
850     end
851   end
852
853   def self.resource_class_for_uuid(uuid)
854     if uuid.is_a? ArvadosModel
855       return uuid.class
856     end
857     unless uuid.is_a? String
858       return nil
859     end
860
861     uuid.match HasUuid::UUID_REGEX do |re|
862       return uuid_prefixes[re[1]] if uuid_prefixes[re[1]]
863     end
864
865     if uuid.match(/.+@.+/)
866       return Email
867     end
868
869     nil
870   end
871
872   # Fill in implied zero/false values in database records that were
873   # created before #17014 made them explicit, and reset the Rails
874   # "changed" state so the record doesn't appear to have been modified
875   # after loading.
876   #
877   # Invoked by Container and ContainerRequest models as an after_find
878   # hook.
879   def fill_container_defaults_after_find
880     fill_container_defaults
881     set_attribute_was('runtime_constraints', runtime_constraints)
882     set_attribute_was('scheduling_parameters', scheduling_parameters)
883     clear_changes_information
884   end
885
886   # Fill in implied zero/false values. Invoked by ContainerRequest as
887   # a before_validation hook in order to (a) ensure every key has a
888   # value in the updated database record and (b) ensure the attribute
889   # whitelist doesn't reject a change from an explicit zero/false
890   # value in the database to an implicit zero/false value in an update
891   # request.
892   def fill_container_defaults
893     self.runtime_constraints = {
894       'API' => false,
895       'keep_cache_ram' => 0,
896       'ram' => 0,
897       'vcpus' => 0,
898     }.merge(attributes['runtime_constraints'] || {})
899     self.scheduling_parameters = {
900       'max_run_time' => 0,
901       'partitions' => [],
902       'preemptible' => false,
903     }.merge(attributes['scheduling_parameters'] || {})
904   end
905
906   # ArvadosModel.find_by_uuid needs extra magic to allow it to return
907   # an object in any class.
908   def self.find_by_uuid uuid
909     if self == ArvadosModel
910       # If called directly as ArvadosModel.find_by_uuid rather than via subclass,
911       # delegate to the appropriate subclass based on the given uuid.
912       self.resource_class_for_uuid(uuid).find_by_uuid(uuid)
913     else
914       super
915     end
916   end
917
918   def is_audit_logging_enabled?
919     return !(Rails.configuration.AuditLogs.MaxAge.to_i == 0 &&
920              Rails.configuration.AuditLogs.MaxDeleteBatch.to_i > 0)
921   end
922
923   def schedule_restoring_changes
924     # This will be checked at log_start_state, to reset any (virtual) changes
925     # produced by the act of reading a serialized attribute.
926     @fresh_from_database = true
927   end
928
929   def log_start_state
930     if is_audit_logging_enabled?
931       @old_attributes = Marshal.load(Marshal.dump(attributes))
932       @old_logged_attributes = Marshal.load(Marshal.dump(logged_attributes))
933       if @fresh_from_database
934         # This instance was created from reading a database record. Attributes
935         # haven't been changed, but those serialized attributes will be reported
936         # as unpersisted, so we restore them to avoid issues with lock!() and
937         # with_lock().
938         restore_attributes
939         @fresh_from_database = nil
940       end
941     end
942   end
943
944   def log_change(event_type)
945     if is_audit_logging_enabled?
946       log = Log.new(event_type: event_type).fill_object(self)
947       yield log
948       log.save!
949       log_start_state
950     end
951   end
952
953   def log_create
954     if is_audit_logging_enabled?
955       log_change('create') do |log|
956         log.fill_properties('old', nil, nil)
957         log.update_to self
958       end
959     end
960   end
961
962   def log_update
963     if is_audit_logging_enabled?
964       log_change('update') do |log|
965         log.fill_properties('old', etag(@old_attributes), @old_logged_attributes)
966         log.update_to self
967       end
968     end
969   end
970
971   def log_destroy
972     if is_audit_logging_enabled?
973       log_change('delete') do |log|
974         log.fill_properties('old', etag(@old_attributes), @old_logged_attributes)
975         log.update_to nil
976       end
977     end
978   end
979 end