Switch to Oj for JSON parsing.
[arvados.git] / app / models / node.rb
1 class Node < OrvosModel
2   include AssignUuid
3   include KindAndEtag
4   include CommonApiTemplate
5   serialize :info, Hash
6   before_validation :ensure_ping_secret
7   after_update :dnsmasq_update
8
9   MAX_SLOTS = 64
10
11   @@confdir = if Rails.configuration.respond_to? :dnsmasq_conf_dir
12                 Rails.configuration.dnsmasq_conf_dir
13               elsif File.exists? '/etc/dnsmasq.d/.'
14                 '/etc/dnsmasq.d'
15               else
16                 nil
17               end
18   @@domain = Rails.configuration.compute_node_domain rescue `hostname --domain`.strip
19   @@nameservers = Rails.configuration.compute_node_nameservers
20
21   api_accessible :superuser, :extend => :common do |t|
22     t.add :hostname
23     t.add :domain
24     t.add :ip_address
25     t.add :first_ping_at
26     t.add :last_ping_at
27     t.add :info
28     t.add :status
29     t.add lambda { |x| @@nameservers }, :as => :nameservers
30   end
31
32   def info
33     @info ||= Hash.new
34     super
35   end
36
37   def domain
38     super || @@domain
39   end
40
41   def status
42     if !self.last_ping_at
43       if Time.now - self.created_at > 5.minutes
44         'startup-fail'
45       else
46         'pending'
47       end
48     elsif Time.now - self.last_ping_at > 1.hours
49       'missing'
50     else
51       'running'
52     end
53   end
54
55   def ping(o)
56     raise "must have :ip and :ping_secret" unless o[:ip] and o[:ping_secret]
57
58     if o[:ping_secret] != self.info[:ping_secret]
59       logger.info "Ping: secret mismatch: received \"#{o[:ping_secret]}\" != \"#{self.info[:ping_secret]}\""
60       return nil
61     end
62     self.last_ping_at = Time.now
63
64     @bypass_orvos_authorization = true
65
66     # Record IP address
67     if self.ip_address.nil?
68       logger.info "#{self.uuid} ip_address= #{o[:ip]}"
69       self.ip_address = o[:ip]
70       self.first_ping_at = Time.now
71     end
72
73     # Record instance ID if not already known
74     if !self.info[:ec2_instance_id] and o[:ec2_instance_id]
75       self.info[:ec2_instance_id] = o[:ec2_instance_id]
76       `ec2-create-tags #{self.info[:ec2_instance_id]} --tag 'Name=#{self.uuid}'`
77     end
78
79     # Assign hostname
80     if self.slot_number.nil?
81       try_slot = 0
82       begin
83         self.slot_number = try_slot
84         begin
85           self.save!
86           break
87         rescue ActiveRecord::RecordNotUnique
88           try_slot += 1
89         end
90         raise "No available node slots" if try_slot == MAX_SLOTS
91       end while true
92       self.hostname = self.class.hostname_for_slot(self.slot_number)
93       if info[:ec2_instance_id]
94         `ec2-create-tags #{self.info[:ec2_instance_id]} --tag 'hostname=#{self.hostname}'`
95       end
96     end
97
98     save
99   end
100
101   def start!(ping_url_method)
102     ensure_permission_to_update
103     ping_url = ping_url_method.call({ uuid: self.uuid, ping_secret: self.info[:ping_secret] })
104     cmd = ["ec2-run-instances",
105            "--user-data '#{ping_url}'",
106            "-t c1.xlarge -n 1 -g orvos-compute",
107            "--client-token", self.uuid,
108            Rails.configuration.compute_node_ami
109           ].join(' ')
110     self.info[:ec2_start_command] = cmd
111     logger.info "#{self.uuid} ec2_start_command= #{cmd.inspect}"
112     result = `#{cmd} 2>&1`
113     self.info[:ec2_start_result] = result
114     logger.info "#{self.uuid} ec2_start_result= #{result.inspect}"
115     result.match(/INSTANCE\s*(i-[0-9a-f]+)/) do |m|
116       instance_id = m[1]
117       self.info[:ec2_instance_id] = instance_id
118       `ec2-create-tags #{instance_id} --tag 'Name=#{self.uuid}'`
119     end
120     self.save!
121   end
122
123   protected
124
125   def ensure_ping_secret
126     self.info[:ping_secret] ||= rand(2**256).to_s(36)
127   end
128
129   def dnsmasq_update
130     if self.hostname_changed? or self.ip_address_changed?
131       if self.hostname and self.ip_address
132         self.class.dnsmasq_update(self.hostname, self.ip_address)
133       end
134     end
135   end
136
137   def self.dnsmasq_update(hostname, ip_address)
138     return unless @@confdir
139     ptr_domain = ip_address.
140       split('.').reverse.join('.').concat('.in-addr.arpa')
141     hostfile = File.join @@confdir, hostname
142     File.open hostfile, 'w' do |f|
143       f.puts "address=/#{hostname}/#{ip_address}"
144       f.puts "address=/#{hostname}.#{@@domain}/#{ip_address}" if @@domain
145       f.puts "ptr-record=#{ptr_domain},#{hostname}"
146     end
147     File.open(File.join(@@confdir, 'restart.txt'), 'w') do |f|
148       # this should trigger a dnsmasq restart
149     end
150   end
151
152   def self.hostname_for_slot(slot_number)
153     "compute#{slot_number}"
154   end
155
156   # At startup, make sure all DNS entries exist.  Otherwise, slurmctld
157   # will refuse to start.
158   if @@confdir and
159       !File.exists? (File.join(@@confdir, hostname_for_slot(MAX_SLOTS-1)))
160     (0..MAX_SLOTS-1).each do |slot_number|
161       hostname = hostname_for_slot(slot_number)
162       hostfile = File.join @@confdir, hostname
163       if !File.exists? hostfile
164         dnsmasq_update(hostname, '127.40.4.0')
165       end
166     end
167   end
168
169   def permission_to_update
170     @bypass_orvos_authorization or super
171   end
172
173   def permission_to_create
174     current_user and current_user.is_admin
175   end
176 end