Unsubscribe message now takes filter definition instead of filter_id, reducing
[arvados.git] / services / api / lib / eventbus.rb
1 require 'eventmachine'
2 require 'oj'
3 require 'faye/websocket'
4 require 'record_filters'
5 require 'load_param'
6
7 # Patch in user, last_log_id and filters fields into the Faye::Websocket class.
8 module Faye
9   class WebSocket
10     attr_accessor :user
11     attr_accessor :last_log_id
12     attr_accessor :filters
13   end
14 end
15
16 # Store the filters supplied by the user that will be applied to the logs table
17 # to determine which events to return to the listener.
18 class Filter
19   include LoadParam
20
21   attr_accessor :filters
22
23   def initialize p
24     @params = p
25     load_filters_param
26   end
27
28   def params
29     @params
30   end
31 end
32
33 # Manages websocket connections, accepts subscription messages and publishes
34 # log table events.
35 class EventBus
36   include CurrentApiClient
37   include RecordFilters
38
39   # used in RecordFilters
40   def model_class
41     Log
42   end
43
44   # Initialize EventBus.  Takes no parameters.
45   def initialize
46     @channel = EventMachine::Channel.new
47     @mtx = Mutex.new
48     @bgthread = false
49   end
50
51   # Push out any pending events to the connection +ws+
52   # +id+  the id of the most recent row in the log table, may be nil
53   def push_events ws, id = nil
54       begin
55         # Must have at least one filter set up to receive events
56         if ws.filters.length > 0
57           # Start with log rows readable by user, sorted in ascending order
58           logs = Log.readable_by(ws.user).order("id asc")
59
60           if ws.last_log_id
61             # Client is only interested in log rows that are newer than the
62             # last log row seen by the client.
63             logs = logs.where("logs.id > ?", ws.last_log_id)
64           elsif id
65             # No last log id, so only look at the most recently changed row
66             logs = logs.where("logs.id = ?", id.to_i)
67           else
68             return
69           end
70
71           # Now process filters provided by client
72           cond_out = []
73           param_out = []
74           ws.filters.each do |filter|
75             ft = record_filters filter.filters, Log.table_name
76             cond_out += ft[:cond_out]
77             param_out += ft[:param_out]
78           end
79
80           # Add filters to query
81           if cond_out.any?
82             logs = logs.where(cond_out.join(' OR '), *param_out)
83           end
84
85           # Finally execute query and actually send the matching log rows
86           logs.each do |l|
87             ws.send(l.as_api_response.to_json)
88             ws.last_log_id = l.id
89           end
90         elsif id
91           # No filters set up, so just record the sequence number
92           ws.last_log_id = id.to_i
93         end
94       rescue Exception => e
95         puts "Error publishing event: #{$!}"
96         puts "Backtrace:\n\t#{e.backtrace.join("\n\t")}"
97         ws.send ({status: 500, message: 'error'}.to_json)
98         ws.close
99       end
100   end
101
102   # Constant maximum number of filters, to avoid silly huge database queries.
103   MAX_FILTERS = 16
104
105   # Called by RackSocket when a new websocket connection has been established.
106   def on_connect ws
107
108     # Disconnect if no valid API token.
109     # current_user is included from CurrentApiClient
110     if not current_user
111       ws.send ({status: 401, message: "Valid API token required"}.to_json)
112       ws.close
113       return
114     end
115
116     # Initialize our custom fields on the websocket connection object.
117     ws.user = current_user
118     ws.filters = []
119     ws.last_log_id = nil
120
121     # Subscribe to internal postgres notifications through @channel.  This will
122     # call push_events when a notification comes through.
123     sub = @channel.subscribe do |msg|
124       push_events ws, msg
125     end
126
127     # Set up callback for inbound message dispatch.
128     ws.on :message do |event|
129       begin
130         # Parse event data as JSON
131         p = (Oj.load event.data).symbolize_keys
132
133         if p[:method] == 'subscribe'
134           # Handle subscribe event
135
136           if p[:last_log_id]
137             # Set or reset the last_log_id.  The event bus only reports events
138             # for rows that come after last_log_id.
139             ws.last_log_id = p[:last_log_id].to_i
140           end
141
142           if ws.filters.length < MAX_FILTERS
143             # Add a filter.  This gets the :filters field which is the same
144             # format as used for regular index queries.
145             ws.filters << Filter.new(p)
146             ws.send ({status: 200, message: 'subscribe ok'}.to_json)
147
148             # Send any pending events
149             push_events ws
150           else
151             ws.send ({status: 403, message: "maximum of #{MAX_FILTERS} filters allowed per connection"}.to_json)
152           end
153
154         elsif p[:method] == 'unsubscribe'
155           # Handle unsubscribe event
156
157           len = ws.filters.length
158           ws.filters.select! { |f| not ((f.filters == p[:filters]) or (f.filters.empty? and p[:filters].nil?)) }
159           if ws.filters.length < len
160             ws.send ({status: 200, message: 'unsubscribe ok'}.to_json)
161           else
162             ws.send ({status: 404, message: 'filter not found'}.to_json)
163           end
164
165         else
166           ws.send ({status: 400, message: "missing or unrecognized method"}.to_json)
167         end
168       rescue Oj::Error => e
169         ws.send ({status: 400, message: "malformed request"}.to_json)
170       rescue Exception => e
171         puts "Error handling message: #{$!}"
172         puts "Backtrace:\n\t#{e.backtrace.join("\n\t")}"
173         ws.send ({status: 500, message: 'error'}.to_json)
174         ws.close
175       end
176     end
177
178     # Set up socket close callback
179     ws.on :close do |event|
180       @channel.unsubscribe sub
181       ws = nil
182     end
183
184     # Start up thread to monitor the Postgres database, if none exists already.
185     @mtx.synchronize do
186       unless @bgthread
187         @bgthread = true
188         Thread.new do
189           # from http://stackoverflow.com/questions/16405520/postgres-listen-notify-rails
190           ActiveRecord::Base.connection_pool.with_connection do |connection|
191             conn = connection.instance_variable_get(:@connection)
192             begin
193               conn.async_exec "LISTEN logs"
194               while true
195                 # wait_for_notify will block until there is a change
196                 # notification from Postgres about the logs table, then push
197                 # the notification into the EventMachine channel.  Each
198                 # websocket connection subscribes to the other end of the
199                 # channel and calls #push_events to actually dispatch the
200                 # events to the client.
201                 conn.wait_for_notify do |channel, pid, payload|
202                   @channel.push payload
203                 end
204               end
205             ensure
206               # Don't want the connection to still be listening once we return
207               # it to the pool - could result in weird behavior for the next
208               # thread to check it out.
209               conn.async_exec "UNLISTEN *"
210             end
211           end
212         end
213       end
214     end
215
216     # Since EventMachine is an asynchronous event based dispatcher, #on_connect
217     # does not block but instead returns immediately after having set up the
218     # websocket and notification channel callbacks.
219   end
220 end