Merge branch '5305-arv-copy-fixes' closes #5305
[arvados.git] / sdk / cli / bin / crunch-job
1 #!/usr/bin/perl
2 # -*- mode: perl; perl-indent-level: 2; indent-tabs-mode: nil; -*-
3
4 =head1 NAME
5
6 crunch-job: Execute job steps, save snapshots as requested, collate output.
7
8 =head1 SYNOPSIS
9
10 Obtain job details from Arvados, run tasks on compute nodes (typically
11 invoked by scheduler on controller):
12
13  crunch-job --job x-y-z --git-dir /path/to/repo/.git
14
15 Obtain job details from command line, run tasks on local machine
16 (typically invoked by application or developer on VM):
17
18  crunch-job --job '{"script_version":"/path/to/working/tree","script":"scriptname",...}'
19
20  crunch-job --job '{"repository":"https://github.com/curoverse/arvados.git","script_version":"master","script":"scriptname",...}'
21
22 =head1 OPTIONS
23
24 =over
25
26 =item --force-unlock
27
28 If the job is already locked, steal the lock and run it anyway.
29
30 =item --git-dir
31
32 Path to a .git directory (or a git URL) where the commit given in the
33 job's C<script_version> attribute is to be found. If this is I<not>
34 given, the job's C<repository> attribute will be used.
35
36 =item --job-api-token
37
38 Arvados API authorization token to use during the course of the job.
39
40 =item --no-clear-tmp
41
42 Do not clear per-job/task temporary directories during initial job
43 setup. This can speed up development and debugging when running jobs
44 locally.
45
46 =item --job
47
48 UUID of the job to run, or a JSON-encoded job resource without a
49 UUID. If the latter is given, a new job object will be created.
50
51 =back
52
53 =head1 RUNNING JOBS LOCALLY
54
55 crunch-job's log messages appear on stderr along with the job tasks'
56 stderr streams. The log is saved in Keep at each checkpoint and when
57 the job finishes.
58
59 If the job succeeds, the job's output locator is printed on stdout.
60
61 While the job is running, the following signals are accepted:
62
63 =over
64
65 =item control-C, SIGINT, SIGQUIT
66
67 Save a checkpoint, terminate any job tasks that are running, and stop.
68
69 =item SIGALRM
70
71 Save a checkpoint and continue.
72
73 =item SIGHUP
74
75 Refresh node allocation (i.e., check whether any nodes have been added
76 or unallocated) and attributes of the Job record that should affect
77 behavior (e.g., cancel job if cancelled_at becomes non-nil).
78
79 =back
80
81 =cut
82
83
84 use strict;
85 use POSIX ':sys_wait_h';
86 use POSIX qw(strftime);
87 use Fcntl qw(F_GETFL F_SETFL O_NONBLOCK);
88 use Arvados;
89 use Cwd qw(realpath);
90 use Data::Dumper;
91 use Digest::MD5 qw(md5_hex);
92 use Getopt::Long;
93 use IPC::Open2;
94 use IO::Select;
95 use File::Temp;
96 use Fcntl ':flock';
97 use File::Path qw( make_path remove_tree );
98
99 use constant EX_TEMPFAIL => 75;
100
101 $ENV{"TMPDIR"} ||= "/tmp";
102 unless (defined $ENV{"CRUNCH_TMP"}) {
103   $ENV{"CRUNCH_TMP"} = $ENV{"TMPDIR"} . "/crunch-job";
104   if ($ENV{"USER"} ne "crunch" && $< != 0) {
105     # use a tmp dir unique for my uid
106     $ENV{"CRUNCH_TMP"} .= "-$<";
107   }
108 }
109
110 # Create the tmp directory if it does not exist
111 if ( ! -d $ENV{"CRUNCH_TMP"} ) {
112   make_path $ENV{"CRUNCH_TMP"} or die "Failed to create temporary working directory: " . $ENV{"CRUNCH_TMP"};
113 }
114
115 $ENV{"JOB_WORK"} = $ENV{"CRUNCH_TMP"} . "/work";
116 $ENV{"CRUNCH_INSTALL"} = "$ENV{CRUNCH_TMP}/opt";
117 $ENV{"CRUNCH_WORK"} = $ENV{"JOB_WORK"}; # deprecated
118 mkdir ($ENV{"JOB_WORK"});
119
120 my $force_unlock;
121 my $git_dir;
122 my $jobspec;
123 my $job_api_token;
124 my $no_clear_tmp;
125 my $resume_stash;
126 GetOptions('force-unlock' => \$force_unlock,
127            'git-dir=s' => \$git_dir,
128            'job=s' => \$jobspec,
129            'job-api-token=s' => \$job_api_token,
130            'no-clear-tmp' => \$no_clear_tmp,
131            'resume-stash=s' => \$resume_stash,
132     );
133
134 if (defined $job_api_token) {
135   $ENV{ARVADOS_API_TOKEN} = $job_api_token;
136 }
137
138 my $have_slurm = exists $ENV{SLURM_JOBID} && exists $ENV{SLURM_NODELIST};
139 my $local_job = 0;
140
141
142 $SIG{'USR1'} = sub
143 {
144   $main::ENV{CRUNCH_DEBUG} = 1;
145 };
146 $SIG{'USR2'} = sub
147 {
148   $main::ENV{CRUNCH_DEBUG} = 0;
149 };
150
151
152
153 my $arv = Arvados->new('apiVersion' => 'v1');
154
155 my $Job;
156 my $job_id;
157 my $dbh;
158 my $sth;
159 my @jobstep;
160
161 my $User = api_call("users/current");
162
163 if ($jobspec =~ /^[-a-z\d]+$/)
164 {
165   # $jobspec is an Arvados UUID, not a JSON job specification
166   $Job = api_call("jobs/get", uuid => $jobspec);
167   if (!$force_unlock) {
168     # Claim this job, and make sure nobody else does
169     eval { api_call("jobs/lock", uuid => $Job->{uuid}); };
170     if ($@) {
171       Log(undef, "Error while locking job, exiting ".EX_TEMPFAIL);
172       exit EX_TEMPFAIL;
173     };
174   }
175 }
176 else
177 {
178   $Job = JSON::decode_json($jobspec);
179
180   if (!$resume_stash)
181   {
182     map { croak ("No $_ specified") unless $Job->{$_} }
183     qw(script script_version script_parameters);
184   }
185
186   $Job->{'is_locked_by_uuid'} = $User->{'uuid'};
187   $Job->{'started_at'} = gmtime;
188   $Job->{'state'} = 'Running';
189
190   $Job = api_call("jobs/create", job => $Job);
191 }
192 $job_id = $Job->{'uuid'};
193
194 my $keep_logfile = $job_id . '.log.txt';
195 log_writer_start($keep_logfile);
196
197 $Job->{'runtime_constraints'} ||= {};
198 $Job->{'runtime_constraints'}->{'max_tasks_per_node'} ||= 0;
199 my $max_ncpus = $Job->{'runtime_constraints'}->{'max_tasks_per_node'};
200
201 my $gem_versions = `gem list --quiet arvados-cli 2>/dev/null`;
202 if ($? == 0) {
203   $gem_versions =~ s/^arvados-cli \(/ with arvados-cli Gem version(s) /;
204   chomp($gem_versions);
205   chop($gem_versions);  # Closing parentheses
206 } else {
207   $gem_versions = "";
208 }
209 Log(undef,
210     "running from " . ((-e $0) ? realpath($0) : "stdin") . $gem_versions);
211
212 Log (undef, "check slurm allocation");
213 my @slot;
214 my @node;
215 # Should use $ENV{SLURM_TASKS_PER_NODE} instead of sinfo? (eg. "4(x3),2,4(x2)")
216 my @sinfo;
217 if (!$have_slurm)
218 {
219   my $localcpus = 0 + `grep -cw ^processor /proc/cpuinfo` || 1;
220   push @sinfo, "$localcpus localhost";
221 }
222 if (exists $ENV{SLURM_NODELIST})
223 {
224   push @sinfo, `sinfo -h --format='%c %N' --nodes=\Q$ENV{SLURM_NODELIST}\E`;
225 }
226 foreach (@sinfo)
227 {
228   my ($ncpus, $slurm_nodelist) = split;
229   $ncpus = $max_ncpus if $max_ncpus && $ncpus > $max_ncpus;
230
231   my @nodelist;
232   while ($slurm_nodelist =~ s/^([^\[,]+?(\[.*?\])?)(,|$)//)
233   {
234     my $nodelist = $1;
235     if ($nodelist =~ /\[((\d+)(-(\d+))?(,(\d+)(-(\d+))?)*)\]/)
236     {
237       my $ranges = $1;
238       foreach (split (",", $ranges))
239       {
240         my ($a, $b);
241         if (/(\d+)-(\d+)/)
242         {
243           $a = $1;
244           $b = $2;
245         }
246         else
247         {
248           $a = $_;
249           $b = $_;
250         }
251         push @nodelist, map {
252           my $n = $nodelist;
253           $n =~ s/\[[-,\d]+\]/$_/;
254           $n;
255         } ($a..$b);
256       }
257     }
258     else
259     {
260       push @nodelist, $nodelist;
261     }
262   }
263   foreach my $nodename (@nodelist)
264   {
265     Log (undef, "node $nodename - $ncpus slots");
266     my $node = { name => $nodename,
267                  ncpus => $ncpus,
268                  losing_streak => 0,
269                  hold_until => 0 };
270     foreach my $cpu (1..$ncpus)
271     {
272       push @slot, { node => $node,
273                     cpu => $cpu };
274     }
275   }
276   push @node, @nodelist;
277 }
278
279
280
281 # Ensure that we get one jobstep running on each allocated node before
282 # we start overloading nodes with concurrent steps
283
284 @slot = sort { $a->{cpu} <=> $b->{cpu} } @slot;
285
286
287 $Job->update_attributes(
288   'tasks_summary' => { 'failed' => 0,
289                        'todo' => 1,
290                        'running' => 0,
291                        'done' => 0 });
292
293 Log (undef, "start");
294 $SIG{'INT'} = sub { $main::please_freeze = 1; };
295 $SIG{'QUIT'} = sub { $main::please_freeze = 1; };
296 $SIG{'TERM'} = \&croak;
297 $SIG{'TSTP'} = sub { $main::please_freeze = 1; };
298 $SIG{'ALRM'} = sub { $main::please_info = 1; };
299 $SIG{'CONT'} = sub { $main::please_continue = 1; };
300 $SIG{'HUP'} = sub { $main::please_refresh = 1; };
301
302 $main::please_freeze = 0;
303 $main::please_info = 0;
304 $main::please_continue = 0;
305 $main::please_refresh = 0;
306 my $jobsteps_must_output_keys = 0;      # becomes 1 when any task outputs a key
307
308 grep { $ENV{$1} = $2 if /^(NOCACHE.*?)=(.*)/ } split ("\n", $$Job{knobs});
309 $ENV{"CRUNCH_JOB_UUID"} = $job_id;
310 $ENV{"JOB_UUID"} = $job_id;
311
312
313 my @jobstep_todo = ();
314 my @jobstep_done = ();
315 my @jobstep_tomerge = ();
316 my $jobstep_tomerge_level = 0;
317 my $squeue_checked;
318 my $squeue_kill_checked;
319 my $latest_refresh = scalar time;
320
321
322
323 if (defined $Job->{thawedfromkey})
324 {
325   thaw ($Job->{thawedfromkey});
326 }
327 else
328 {
329   my $first_task = api_call("job_tasks/create", job_task => {
330     'job_uuid' => $Job->{'uuid'},
331     'sequence' => 0,
332     'qsequence' => 0,
333     'parameters' => {},
334   });
335   push @jobstep, { 'level' => 0,
336                    'failures' => 0,
337                    'arvados_task' => $first_task,
338                  };
339   push @jobstep_todo, 0;
340 }
341
342
343 if (!$have_slurm)
344 {
345   must_lock_now("$ENV{CRUNCH_TMP}/.lock", "a job is already running here.");
346 }
347
348 my $build_script = handle_readall(\*DATA);
349 my $nodelist = join(",", @node);
350 my $git_tar_count = 0;
351
352 if (!defined $no_clear_tmp) {
353   # Clean out crunch_tmp/work, crunch_tmp/opt, crunch_tmp/src*
354   Log (undef, "Clean work dirs");
355
356   my $cleanpid = fork();
357   if ($cleanpid == 0)
358   {
359     # Find FUSE mounts that look like Keep mounts (the mount path has the
360     # word "keep") and unmount them.  Then clean up work directories.
361     # TODO: When #5036 is done and widely deployed, we can get rid of the
362     # regular expression and just unmount everything with type fuse.keep.
363     srun (["srun", "--nodelist=$nodelist", "-D", $ENV{'TMPDIR'}],
364           ['bash', '-ec', 'mount -t fuse,fuse.keep | awk \'($3 ~ /\ykeep\y/){print $3}\' | xargs -r -n 1 fusermount -u -z; sleep 1; rm -rf $JOB_WORK $CRUNCH_INSTALL $CRUNCH_TMP/task $CRUNCH_TMP/src*']);
365     exit (1);
366   }
367   while (1)
368   {
369     last if $cleanpid == waitpid (-1, WNOHANG);
370     freeze_if_want_freeze ($cleanpid);
371     select (undef, undef, undef, 0.1);
372   }
373   Log (undef, "Cleanup command exited ".exit_status_s($?));
374 }
375
376 # If this job requires a Docker image, install that.
377 my $docker_bin = "/usr/bin/docker.io";
378 my ($docker_locator, $docker_stream, $docker_hash);
379 if ($docker_locator = $Job->{docker_image_locator}) {
380   ($docker_stream, $docker_hash) = find_docker_image($docker_locator);
381   if (!$docker_hash)
382   {
383     croak("No Docker image hash found from locator $docker_locator");
384   }
385   $docker_stream =~ s/^\.//;
386   my $docker_install_script = qq{
387 if ! $docker_bin images -q --no-trunc | grep -qxF \Q$docker_hash\E; then
388     arv-get \Q$docker_locator$docker_stream/$docker_hash.tar\E | $docker_bin load
389 fi
390 };
391   my $docker_pid = fork();
392   if ($docker_pid == 0)
393   {
394     srun (["srun", "--nodelist=" . join(',', @node)],
395           ["/bin/sh", "-ec", $docker_install_script]);
396     exit ($?);
397   }
398   while (1)
399   {
400     last if $docker_pid == waitpid (-1, WNOHANG);
401     freeze_if_want_freeze ($docker_pid);
402     select (undef, undef, undef, 0.1);
403   }
404   if ($? != 0)
405   {
406     croak("Installing Docker image from $docker_locator exited "
407           .exit_status_s($?));
408   }
409
410   if ($Job->{arvados_sdk_version}) {
411     # The job also specifies an Arvados SDK version.  Add the SDKs to the
412     # tar file for the build script to install.
413     Log(undef, sprintf("Packing Arvados SDK version %s for installation",
414                        $Job->{arvados_sdk_version}));
415     add_git_archive("git", "--git-dir=$git_dir", "archive",
416                     "--prefix=.arvados.sdk/",
417                     $Job->{arvados_sdk_version}, "sdk");
418   }
419 }
420
421 if (!defined $git_dir && $Job->{'script_version'} =~ m{^/}) {
422   # If script_version looks like an absolute path, *and* the --git-dir
423   # argument was not given -- which implies we were not invoked by
424   # crunch-dispatch -- we will use the given path as a working
425   # directory instead of resolving script_version to a git commit (or
426   # doing anything else with git).
427   $ENV{"CRUNCH_SRC_COMMIT"} = $Job->{'script_version'};
428   $ENV{"CRUNCH_SRC"} = $Job->{'script_version'};
429 }
430 else {
431   # Resolve the given script_version to a git commit sha1. Also, if
432   # the repository is remote, clone it into our local filesystem: this
433   # ensures "git archive" will work, and is necessary to reliably
434   # resolve a symbolic script_version like "master^".
435   $ENV{"CRUNCH_SRC"} = "$ENV{CRUNCH_TMP}/src";
436
437   Log (undef, "Looking for version ".$Job->{script_version}." from repository ".$Job->{repository});
438
439   $ENV{"CRUNCH_SRC_COMMIT"} = $Job->{script_version};
440
441   # If we're running under crunch-dispatch, it will have already
442   # pulled the appropriate source tree into its own repository, and
443   # given us that repo's path as $git_dir.
444   #
445   # If we're running a "local" job, we might have to fetch content
446   # from a remote repository.
447   #
448   # (Currently crunch-dispatch gives a local path with --git-dir, but
449   # we might as well accept URLs there too in case it changes its
450   # mind.)
451   my $repo = $git_dir || $Job->{'repository'};
452
453   # Repository can be remote or local. If remote, we'll need to fetch it
454   # to a local dir before doing `git log` et al.
455   my $repo_location;
456
457   if ($repo =~ m{://|^[^/]*:}) {
458     # $repo is a git url we can clone, like git:// or https:// or
459     # file:/// or [user@]host:repo.git. Note "user/name@host:foo" is
460     # not recognized here because distinguishing that from a local
461     # path is too fragile. If you really need something strange here,
462     # use the ssh:// form.
463     $repo_location = 'remote';
464   } elsif ($repo =~ m{^\.*/}) {
465     # $repo is a local path to a git index. We'll also resolve ../foo
466     # to ../foo/.git if the latter is a directory. To help
467     # disambiguate local paths from named hosted repositories, this
468     # form must be given as ./ or ../ if it's a relative path.
469     if (-d "$repo/.git") {
470       $repo = "$repo/.git";
471     }
472     $repo_location = 'local';
473   } else {
474     # $repo is none of the above. It must be the name of a hosted
475     # repository.
476     my $arv_repo_list = api_call("repositories/list",
477                                  'filters' => [['name','=',$repo]]);
478     my @repos_found = @{$arv_repo_list->{'items'}};
479     my $n_found = $arv_repo_list->{'serverResponse'}->{'items_available'};
480     if ($n_found > 0) {
481       Log(undef, "Repository '$repo' -> "
482           . join(", ", map { $_->{'uuid'} } @repos_found));
483     }
484     if ($n_found != 1) {
485       croak("Error: Found $n_found repositories with name '$repo'.");
486     }
487     $repo = $repos_found[0]->{'fetch_url'};
488     $repo_location = 'remote';
489   }
490   Log(undef, "Using $repo_location repository '$repo'");
491   $ENV{"CRUNCH_SRC_URL"} = $repo;
492
493   # Resolve given script_version (we'll call that $treeish here) to a
494   # commit sha1 ($commit).
495   my $treeish = $Job->{'script_version'};
496   my $commit;
497   if ($repo_location eq 'remote') {
498     # We minimize excess object-fetching by re-using the same bare
499     # repository in CRUNCH_TMP/.git for multiple crunch-jobs -- we
500     # just keep adding remotes to it as needed.
501     my $local_repo = $ENV{'CRUNCH_TMP'}."/.git";
502     my $gitcmd = "git --git-dir=\Q$local_repo\E";
503
504     # Set up our local repo for caching remote objects, making
505     # archives, etc.
506     if (!-d $local_repo) {
507       make_path($local_repo) or croak("Error: could not create $local_repo");
508     }
509     # This works (exits 0 and doesn't delete fetched objects) even
510     # if $local_repo is already initialized:
511     `$gitcmd init --bare`;
512     if ($?) {
513       croak("Error: $gitcmd init --bare exited ".exit_status_s($?));
514     }
515
516     # If $treeish looks like a hash (or abbrev hash) we look it up in
517     # our local cache first, since that's cheaper. (We don't want to
518     # do that with tags/branches though -- those change over time, so
519     # they should always be resolved by the remote repo.)
520     if ($treeish =~ /^[0-9a-f]{7,40}$/s) {
521       # Hide stderr because it's normal for this to fail:
522       my $sha1 = `$gitcmd rev-list -n1 ''\Q$treeish\E 2>/dev/null`;
523       if ($? == 0 &&
524           # Careful not to resolve a branch named abcdeff to commit 1234567:
525           $sha1 =~ /^$treeish/ &&
526           $sha1 =~ /^([0-9a-f]{40})$/s) {
527         $commit = $1;
528         Log(undef, "Commit $commit already present in $local_repo");
529       }
530     }
531
532     if (!defined $commit) {
533       # If $treeish isn't just a hash or abbrev hash, or isn't here
534       # yet, we need to fetch the remote to resolve it correctly.
535
536       # First, remove all local heads. This prevents a name that does
537       # not exist on the remote from resolving to (or colliding with)
538       # a previously fetched branch or tag (possibly from a different
539       # remote).
540       remove_tree("$local_repo/refs/heads", {keep_root => 1});
541
542       Log(undef, "Fetching objects from $repo to $local_repo");
543       `$gitcmd fetch --no-progress --tags ''\Q$repo\E \Q+refs/heads/*:refs/heads/*\E`;
544       if ($?) {
545         croak("Error: `$gitcmd fetch` exited ".exit_status_s($?));
546       }
547     }
548
549     # Now that the data is all here, we will use our local repo for
550     # the rest of our git activities.
551     $repo = $local_repo;
552   }
553
554   my $gitcmd = "git --git-dir=\Q$repo\E";
555   my $sha1 = `$gitcmd rev-list -n1 ''\Q$treeish\E`;
556   unless ($? == 0 && $sha1 =~ /^([0-9a-f]{40})$/) {
557     croak("`$gitcmd rev-list` exited "
558           .exit_status_s($?)
559           .", '$treeish' not found. Giving up.");
560   }
561   $commit = $1;
562   Log(undef, "Version $treeish is commit $commit");
563
564   if ($commit ne $Job->{'script_version'}) {
565     # Record the real commit id in the database, frozentokey, logs,
566     # etc. -- instead of an abbreviation or a branch name which can
567     # become ambiguous or point to a different commit in the future.
568     if (!$Job->update_attributes('script_version' => $commit)) {
569       croak("Error: failed to update job's script_version attribute");
570     }
571   }
572
573   $ENV{"CRUNCH_SRC_COMMIT"} = $commit;
574   add_git_archive("$gitcmd archive ''\Q$commit\E");
575 }
576
577 my $git_archive = combined_git_archive();
578 if (!defined $git_archive) {
579   Log(undef, "Skip install phase (no git archive)");
580   if ($have_slurm) {
581     Log(undef, "Warning: This probably means workers have no source tree!");
582   }
583 }
584 else {
585   Log(undef, "Run install script on all workers");
586
587   my @srunargs = ("srun",
588                   "--nodelist=$nodelist",
589                   "-D", $ENV{'TMPDIR'}, "--job-name=$job_id");
590   my @execargs = ("sh", "-c",
591                   "mkdir -p $ENV{CRUNCH_INSTALL} && cd $ENV{CRUNCH_TMP} && perl -");
592
593   my $installpid = fork();
594   if ($installpid == 0)
595   {
596     srun (\@srunargs, \@execargs, {}, $build_script . $git_archive);
597     exit (1);
598   }
599   while (1)
600   {
601     last if $installpid == waitpid (-1, WNOHANG);
602     freeze_if_want_freeze ($installpid);
603     select (undef, undef, undef, 0.1);
604   }
605   my $install_exited = $?;
606   Log (undef, "Install script exited ".exit_status_s($install_exited));
607   foreach my $tar_filename (map { tar_filename_n($_); } (1..$git_tar_count)) {
608     unlink($tar_filename);
609   }
610   exit (1) if $install_exited != 0;
611 }
612
613 foreach (qw (script script_version script_parameters runtime_constraints))
614 {
615   Log (undef,
616        "$_ " .
617        (ref($Job->{$_}) ? JSON::encode_json($Job->{$_}) : $Job->{$_}));
618 }
619 foreach (split (/\n/, $Job->{knobs}))
620 {
621   Log (undef, "knob " . $_);
622 }
623
624
625
626 $main::success = undef;
627
628
629
630 ONELEVEL:
631
632 my $thisround_succeeded = 0;
633 my $thisround_failed = 0;
634 my $thisround_failed_multiple = 0;
635
636 @jobstep_todo = sort { $jobstep[$a]->{level} <=> $jobstep[$b]->{level}
637                        or $a <=> $b } @jobstep_todo;
638 my $level = $jobstep[$jobstep_todo[0]]->{level};
639 Log (undef, "start level $level");
640
641
642
643 my %proc;
644 my @freeslot = (0..$#slot);
645 my @holdslot;
646 my %reader;
647 my $progress_is_dirty = 1;
648 my $progress_stats_updated = 0;
649
650 update_progress_stats();
651
652
653
654 THISROUND:
655 for (my $todo_ptr = 0; $todo_ptr <= $#jobstep_todo; $todo_ptr ++)
656 {
657   my $id = $jobstep_todo[$todo_ptr];
658   my $Jobstep = $jobstep[$id];
659   if ($Jobstep->{level} != $level)
660   {
661     next;
662   }
663
664   pipe $reader{$id}, "writer" or croak ($!);
665   my $flags = fcntl ($reader{$id}, F_GETFL, 0) or croak ($!);
666   fcntl ($reader{$id}, F_SETFL, $flags | O_NONBLOCK) or croak ($!);
667
668   my $childslot = $freeslot[0];
669   my $childnode = $slot[$childslot]->{node};
670   my $childslotname = join (".",
671                             $slot[$childslot]->{node}->{name},
672                             $slot[$childslot]->{cpu});
673   my $childpid = fork();
674   if ($childpid == 0)
675   {
676     $SIG{'INT'} = 'DEFAULT';
677     $SIG{'QUIT'} = 'DEFAULT';
678     $SIG{'TERM'} = 'DEFAULT';
679
680     foreach (values (%reader))
681     {
682       close($_);
683     }
684     fcntl ("writer", F_SETFL, 0) or croak ($!); # no close-on-exec
685     open(STDOUT,">&writer");
686     open(STDERR,">&writer");
687
688     undef $dbh;
689     undef $sth;
690
691     delete $ENV{"GNUPGHOME"};
692     $ENV{"TASK_UUID"} = $Jobstep->{'arvados_task'}->{'uuid'};
693     $ENV{"TASK_QSEQUENCE"} = $id;
694     $ENV{"TASK_SEQUENCE"} = $level;
695     $ENV{"JOB_SCRIPT"} = $Job->{script};
696     while (my ($param, $value) = each %{$Job->{script_parameters}}) {
697       $param =~ tr/a-z/A-Z/;
698       $ENV{"JOB_PARAMETER_$param"} = $value;
699     }
700     $ENV{"TASK_SLOT_NODE"} = $slot[$childslot]->{node}->{name};
701     $ENV{"TASK_SLOT_NUMBER"} = $slot[$childslot]->{cpu};
702     $ENV{"TASK_WORK"} = $ENV{"CRUNCH_TMP"}."/task/$childslotname";
703     $ENV{"HOME"} = $ENV{"TASK_WORK"};
704     $ENV{"TASK_KEEPMOUNT"} = $ENV{"TASK_WORK"}.".keep";
705     $ENV{"TASK_TMPDIR"} = $ENV{"TASK_WORK"}; # deprecated
706     $ENV{"CRUNCH_NODE_SLOTS"} = $slot[$childslot]->{node}->{ncpus};
707     $ENV{"PATH"} = $ENV{"CRUNCH_INSTALL"} . "/bin:" . $ENV{"PATH"};
708
709     $ENV{"GZIP"} = "-n";
710
711     my @srunargs = (
712       "srun",
713       "--nodelist=".$childnode->{name},
714       qw(-n1 -c1 -N1 -D), $ENV{'TMPDIR'},
715       "--job-name=$job_id.$id.$$",
716         );
717     my $command =
718         "if [ -e $ENV{TASK_WORK} ]; then rm -rf $ENV{TASK_WORK}; fi; "
719         ."mkdir -p $ENV{CRUNCH_TMP} $ENV{JOB_WORK} $ENV{TASK_WORK} $ENV{TASK_KEEPMOUNT} "
720         ."&& cd $ENV{CRUNCH_TMP} ";
721     $command .= "&& exec arv-mount --by-id --allow-other $ENV{TASK_KEEPMOUNT} --exec ";
722     if ($docker_hash)
723     {
724       my $cidfile = "$ENV{CRUNCH_TMP}/$ENV{TASK_UUID}.cid";
725       $command .= "crunchstat -cgroup-root=/sys/fs/cgroup -cgroup-parent=docker -cgroup-cid=$cidfile -poll=10000 ";
726       $command .= "$docker_bin run --rm=true --attach=stdout --attach=stderr --attach=stdin -i --user=crunch --cidfile=$cidfile --sig-proxy ";
727
728       # Dynamically configure the container to use the host system as its
729       # DNS server.  Get the host's global addresses from the ip command,
730       # and turn them into docker --dns options using gawk.
731       $command .=
732           q{$(ip -o address show scope global |
733               gawk 'match($4, /^([0-9\.:]+)\//, x){print "--dns", x[1]}') };
734
735       # The source tree and $destdir directory (which we have
736       # installed on the worker host) are available in the container,
737       # under the same path.
738       $command .= "--volume=\Q$ENV{CRUNCH_SRC}:$ENV{CRUNCH_SRC}:ro\E ";
739       $command .= "--volume=\Q$ENV{CRUNCH_INSTALL}:$ENV{CRUNCH_INSTALL}:ro\E ";
740
741       # Currently, we make arv-mount's mount point appear at /keep
742       # inside the container (instead of using the same path as the
743       # host like we do with CRUNCH_SRC and CRUNCH_INSTALL). However,
744       # crunch scripts and utilities must not rely on this. They must
745       # use $TASK_KEEPMOUNT.
746       $command .= "--volume=\Q$ENV{TASK_KEEPMOUNT}:/keep:ro\E ";
747       $ENV{TASK_KEEPMOUNT} = "/keep";
748
749       # TASK_WORK is almost exactly like a docker data volume: it
750       # starts out empty, is writable, and persists until no
751       # containers use it any more. We don't use --volumes-from to
752       # share it with other containers: it is only accessible to this
753       # task, and it goes away when this task stops.
754       #
755       # However, a docker data volume is writable only by root unless
756       # the mount point already happens to exist in the container with
757       # different permissions. Therefore, we [1] assume /tmp already
758       # exists in the image and is writable by the crunch user; [2]
759       # avoid putting TASK_WORK inside CRUNCH_TMP (which won't be
760       # writable if they are created by docker while setting up the
761       # other --volumes); and [3] create $TASK_WORK inside the
762       # container using $build_script.
763       $command .= "--volume=/tmp ";
764       $ENV{"TASK_WORK"} = "/tmp/crunch-job-task-work/$childslotname";
765       $ENV{"HOME"} = $ENV{"TASK_WORK"};
766       $ENV{"TASK_TMPDIR"} = $ENV{"TASK_WORK"}; # deprecated
767
768       # TODO: Share a single JOB_WORK volume across all task
769       # containers on a given worker node, and delete it when the job
770       # ends (and, in case that doesn't work, when the next job
771       # starts).
772       #
773       # For now, use the same approach as TASK_WORK above.
774       $ENV{"JOB_WORK"} = "/tmp/crunch-job-work";
775
776       while (my ($env_key, $env_val) = each %ENV)
777       {
778         if ($env_key =~ /^(ARVADOS|CRUNCH|JOB|TASK)_/) {
779           $command .= "--env=\Q$env_key=$env_val\E ";
780         }
781       }
782       $command .= "--env=\QHOME=$ENV{HOME}\E ";
783       $command .= "\Q$docker_hash\E ";
784       $command .= "stdbuf --output=0 --error=0 ";
785       $command .= "perl - $ENV{CRUNCH_SRC}/crunch_scripts/" . $Job->{"script"};
786     } else {
787       # Non-docker run
788       $command .= "crunchstat -cgroup-root=/sys/fs/cgroup -poll=10000 ";
789       $command .= "stdbuf --output=0 --error=0 ";
790       $command .= "perl - $ENV{CRUNCH_SRC}/crunch_scripts/" . $Job->{"script"};
791     }
792
793     my @execargs = ('bash', '-c', $command);
794     srun (\@srunargs, \@execargs, undef, $build_script);
795     # exec() failed, we assume nothing happened.
796     die "srun() failed on build script\n";
797   }
798   close("writer");
799   if (!defined $childpid)
800   {
801     close $reader{$id};
802     delete $reader{$id};
803     next;
804   }
805   shift @freeslot;
806   $proc{$childpid} = { jobstep => $id,
807                        time => time,
808                        slot => $childslot,
809                        jobstepname => "$job_id.$id.$childpid",
810                      };
811   croak ("assert failed: \$slot[$childslot]->{'pid'} exists") if exists $slot[$childslot]->{pid};
812   $slot[$childslot]->{pid} = $childpid;
813
814   Log ($id, "job_task ".$Jobstep->{'arvados_task'}->{'uuid'});
815   Log ($id, "child $childpid started on $childslotname");
816   $Jobstep->{starttime} = time;
817   $Jobstep->{node} = $childnode->{name};
818   $Jobstep->{slotindex} = $childslot;
819   delete $Jobstep->{stderr};
820   delete $Jobstep->{finishtime};
821
822   $Jobstep->{'arvados_task'}->{started_at} = strftime "%Y-%m-%dT%H:%M:%SZ", gmtime($Jobstep->{starttime});
823   $Jobstep->{'arvados_task'}->save;
824
825   splice @jobstep_todo, $todo_ptr, 1;
826   --$todo_ptr;
827
828   $progress_is_dirty = 1;
829
830   while (!@freeslot
831          ||
832          (@slot > @freeslot && $todo_ptr+1 > $#jobstep_todo))
833   {
834     last THISROUND if $main::please_freeze;
835     if ($main::please_info)
836     {
837       $main::please_info = 0;
838       freeze();
839       create_output_collection();
840       save_meta(1);
841       update_progress_stats();
842     }
843     my $gotsome
844         = readfrompipes ()
845         + reapchildren ();
846     if (!$gotsome)
847     {
848       check_refresh_wanted();
849       check_squeue();
850       update_progress_stats();
851       select (undef, undef, undef, 0.1);
852     }
853     elsif (time - $progress_stats_updated >= 30)
854     {
855       update_progress_stats();
856     }
857     if (($thisround_failed_multiple >= 8 && $thisround_succeeded == 0) ||
858         ($thisround_failed_multiple >= 16 && $thisround_failed_multiple > $thisround_succeeded))
859     {
860       my $message = "Repeated failure rate too high ($thisround_failed_multiple/"
861           .($thisround_failed+$thisround_succeeded)
862           .") -- giving up on this round";
863       Log (undef, $message);
864       last THISROUND;
865     }
866
867     # move slots from freeslot to holdslot (or back to freeslot) if necessary
868     for (my $i=$#freeslot; $i>=0; $i--) {
869       if ($slot[$freeslot[$i]]->{node}->{hold_until} > scalar time) {
870         push @holdslot, (splice @freeslot, $i, 1);
871       }
872     }
873     for (my $i=$#holdslot; $i>=0; $i--) {
874       if ($slot[$holdslot[$i]]->{node}->{hold_until} <= scalar time) {
875         push @freeslot, (splice @holdslot, $i, 1);
876       }
877     }
878
879     # give up if no nodes are succeeding
880     if (!grep { $_->{node}->{losing_streak} == 0 &&
881                     $_->{node}->{hold_count} < 4 } @slot) {
882       my $message = "Every node has failed -- giving up on this round";
883       Log (undef, $message);
884       last THISROUND;
885     }
886   }
887 }
888
889
890 push @freeslot, splice @holdslot;
891 map { $slot[$freeslot[$_]]->{node}->{losing_streak} = 0 } (0..$#freeslot);
892
893
894 Log (undef, "wait for last ".(scalar keys %proc)." children to finish");
895 while (%proc)
896 {
897   if ($main::please_continue) {
898     $main::please_continue = 0;
899     goto THISROUND;
900   }
901   $main::please_info = 0, freeze(), create_output_collection(), save_meta(1) if $main::please_info;
902   readfrompipes ();
903   if (!reapchildren())
904   {
905     check_refresh_wanted();
906     check_squeue();
907     update_progress_stats();
908     select (undef, undef, undef, 0.1);
909     killem (keys %proc) if $main::please_freeze;
910   }
911 }
912
913 update_progress_stats();
914 freeze_if_want_freeze();
915
916
917 if (!defined $main::success)
918 {
919   if (@jobstep_todo &&
920       $thisround_succeeded == 0 &&
921       ($thisround_failed == 0 || $thisround_failed > 4))
922   {
923     my $message = "stop because $thisround_failed tasks failed and none succeeded";
924     Log (undef, $message);
925     $main::success = 0;
926   }
927   if (!@jobstep_todo)
928   {
929     $main::success = 1;
930   }
931 }
932
933 goto ONELEVEL if !defined $main::success;
934
935
936 release_allocation();
937 freeze();
938 my $collated_output = &create_output_collection();
939
940 if (!$collated_output) {
941   Log (undef, "Failed to write output collection");
942 }
943 else {
944   Log(undef, "job output $collated_output");
945   $Job->update_attributes('output' => $collated_output);
946 }
947
948 Log (undef, "finish");
949
950 save_meta();
951
952 my $final_state;
953 if ($collated_output && $main::success) {
954   $final_state = 'Complete';
955 } else {
956   $final_state = 'Failed';
957 }
958 $Job->update_attributes('state' => $final_state);
959
960 exit (($final_state eq 'Complete') ? 0 : 1);
961
962
963
964 sub update_progress_stats
965 {
966   $progress_stats_updated = time;
967   return if !$progress_is_dirty;
968   my ($todo, $done, $running) = (scalar @jobstep_todo,
969                                  scalar @jobstep_done,
970                                  scalar @slot - scalar @freeslot - scalar @holdslot);
971   $Job->{'tasks_summary'} ||= {};
972   $Job->{'tasks_summary'}->{'todo'} = $todo;
973   $Job->{'tasks_summary'}->{'done'} = $done;
974   $Job->{'tasks_summary'}->{'running'} = $running;
975   $Job->update_attributes('tasks_summary' => $Job->{'tasks_summary'});
976   Log (undef, "status: $done done, $running running, $todo todo");
977   $progress_is_dirty = 0;
978 }
979
980
981
982 sub reapchildren
983 {
984   my $pid = waitpid (-1, WNOHANG);
985   return 0 if $pid <= 0;
986
987   my $whatslot = ($slot[$proc{$pid}->{slot}]->{node}->{name}
988                   . "."
989                   . $slot[$proc{$pid}->{slot}]->{cpu});
990   my $jobstepid = $proc{$pid}->{jobstep};
991   my $elapsed = time - $proc{$pid}->{time};
992   my $Jobstep = $jobstep[$jobstepid];
993
994   my $childstatus = $?;
995   my $exitvalue = $childstatus >> 8;
996   my $exitinfo = "exit ".exit_status_s($childstatus);
997   $Jobstep->{'arvados_task'}->reload;
998   my $task_success = $Jobstep->{'arvados_task'}->{success};
999
1000   Log ($jobstepid, "child $pid on $whatslot $exitinfo success=$task_success");
1001
1002   if (!defined $task_success) {
1003     # task did not indicate one way or the other --> fail
1004     $Jobstep->{'arvados_task'}->{success} = 0;
1005     $Jobstep->{'arvados_task'}->save;
1006     $task_success = 0;
1007   }
1008
1009   if (!$task_success)
1010   {
1011     my $temporary_fail;
1012     $temporary_fail ||= $Jobstep->{node_fail};
1013     $temporary_fail ||= ($exitvalue == 111);
1014
1015     ++$thisround_failed;
1016     ++$thisround_failed_multiple if $Jobstep->{'failures'} >= 1;
1017
1018     # Check for signs of a failed or misconfigured node
1019     if (++$slot[$proc{$pid}->{slot}]->{node}->{losing_streak} >=
1020         2+$slot[$proc{$pid}->{slot}]->{node}->{ncpus}) {
1021       # Don't count this against jobstep failure thresholds if this
1022       # node is already suspected faulty and srun exited quickly
1023       if ($slot[$proc{$pid}->{slot}]->{node}->{hold_until} &&
1024           $elapsed < 5) {
1025         Log ($jobstepid, "blaming failure on suspect node " .
1026              $slot[$proc{$pid}->{slot}]->{node}->{name});
1027         $temporary_fail ||= 1;
1028       }
1029       ban_node_by_slot($proc{$pid}->{slot});
1030     }
1031
1032     Log ($jobstepid, sprintf('failure (#%d, %s) after %d seconds',
1033                              ++$Jobstep->{'failures'},
1034                              $temporary_fail ? 'temporary ' : 'permanent',
1035                              $elapsed));
1036
1037     if (!$temporary_fail || $Jobstep->{'failures'} >= 3) {
1038       # Give up on this task, and the whole job
1039       $main::success = 0;
1040     }
1041     # Put this task back on the todo queue
1042     push @jobstep_todo, $jobstepid;
1043     $Job->{'tasks_summary'}->{'failed'}++;
1044   }
1045   else
1046   {
1047     ++$thisround_succeeded;
1048     $slot[$proc{$pid}->{slot}]->{node}->{losing_streak} = 0;
1049     $slot[$proc{$pid}->{slot}]->{node}->{hold_until} = 0;
1050     push @jobstep_done, $jobstepid;
1051     Log ($jobstepid, "success in $elapsed seconds");
1052   }
1053   $Jobstep->{exitcode} = $childstatus;
1054   $Jobstep->{finishtime} = time;
1055   $Jobstep->{'arvados_task'}->{finished_at} = strftime "%Y-%m-%dT%H:%M:%SZ", gmtime($Jobstep->{finishtime});
1056   $Jobstep->{'arvados_task'}->save;
1057   process_stderr ($jobstepid, $task_success);
1058   Log ($jobstepid, sprintf("task output (%d bytes): %s",
1059                            length($Jobstep->{'arvados_task'}->{output}),
1060                            $Jobstep->{'arvados_task'}->{output}));
1061
1062   close $reader{$jobstepid};
1063   delete $reader{$jobstepid};
1064   delete $slot[$proc{$pid}->{slot}]->{pid};
1065   push @freeslot, $proc{$pid}->{slot};
1066   delete $proc{$pid};
1067
1068   if ($task_success) {
1069     # Load new tasks
1070     my $newtask_list = [];
1071     my $newtask_results;
1072     do {
1073       $newtask_results = api_call(
1074         "job_tasks/list",
1075         'where' => {
1076           'created_by_job_task_uuid' => $Jobstep->{'arvados_task'}->{uuid}
1077         },
1078         'order' => 'qsequence',
1079         'offset' => scalar(@$newtask_list),
1080       );
1081       push(@$newtask_list, @{$newtask_results->{items}});
1082     } while (@{$newtask_results->{items}});
1083     foreach my $arvados_task (@$newtask_list) {
1084       my $jobstep = {
1085         'level' => $arvados_task->{'sequence'},
1086         'failures' => 0,
1087         'arvados_task' => $arvados_task
1088       };
1089       push @jobstep, $jobstep;
1090       push @jobstep_todo, $#jobstep;
1091     }
1092   }
1093
1094   $progress_is_dirty = 1;
1095   1;
1096 }
1097
1098 sub check_refresh_wanted
1099 {
1100   my @stat = stat $ENV{"CRUNCH_REFRESH_TRIGGER"};
1101   if (@stat && $stat[9] > $latest_refresh) {
1102     $latest_refresh = scalar time;
1103     my $Job2 = api_call("jobs/get", uuid => $jobspec);
1104     for my $attr ('cancelled_at',
1105                   'cancelled_by_user_uuid',
1106                   'cancelled_by_client_uuid',
1107                   'state') {
1108       $Job->{$attr} = $Job2->{$attr};
1109     }
1110     if ($Job->{'state'} ne "Running") {
1111       if ($Job->{'state'} eq "Cancelled") {
1112         Log (undef, "Job cancelled at " . $Job->{'cancelled_at'} . " by user " . $Job->{'cancelled_by_user_uuid'});
1113       } else {
1114         Log (undef, "Job state unexpectedly changed to " . $Job->{'state'});
1115       }
1116       $main::success = 0;
1117       $main::please_freeze = 1;
1118     }
1119   }
1120 }
1121
1122 sub check_squeue
1123 {
1124   # return if the kill list was checked <4 seconds ago
1125   if (defined $squeue_kill_checked && $squeue_kill_checked > time - 4)
1126   {
1127     return;
1128   }
1129   $squeue_kill_checked = time;
1130
1131   # use killem() on procs whose killtime is reached
1132   for (keys %proc)
1133   {
1134     if (exists $proc{$_}->{killtime}
1135         && $proc{$_}->{killtime} <= time)
1136     {
1137       killem ($_);
1138     }
1139   }
1140
1141   # return if the squeue was checked <60 seconds ago
1142   if (defined $squeue_checked && $squeue_checked > time - 60)
1143   {
1144     return;
1145   }
1146   $squeue_checked = time;
1147
1148   if (!$have_slurm)
1149   {
1150     # here is an opportunity to check for mysterious problems with local procs
1151     return;
1152   }
1153
1154   # get a list of steps still running
1155   my @squeue = `squeue -s -h -o '%i %j' && echo ok`;
1156   chop @squeue;
1157   if ($squeue[-1] ne "ok")
1158   {
1159     return;
1160   }
1161   pop @squeue;
1162
1163   # which of my jobsteps are running, according to squeue?
1164   my %ok;
1165   foreach (@squeue)
1166   {
1167     if (/^(\d+)\.(\d+) (\S+)/)
1168     {
1169       if ($1 eq $ENV{SLURM_JOBID})
1170       {
1171         $ok{$3} = 1;
1172       }
1173     }
1174   }
1175
1176   # which of my active child procs (>60s old) were not mentioned by squeue?
1177   foreach (keys %proc)
1178   {
1179     if ($proc{$_}->{time} < time - 60
1180         && !exists $ok{$proc{$_}->{jobstepname}}
1181         && !exists $proc{$_}->{killtime})
1182     {
1183       # kill this proc if it hasn't exited in 30 seconds
1184       $proc{$_}->{killtime} = time + 30;
1185     }
1186   }
1187 }
1188
1189
1190 sub release_allocation
1191 {
1192   if ($have_slurm)
1193   {
1194     Log (undef, "release job allocation");
1195     system "scancel $ENV{SLURM_JOBID}";
1196   }
1197 }
1198
1199
1200 sub readfrompipes
1201 {
1202   my $gotsome = 0;
1203   foreach my $job (keys %reader)
1204   {
1205     my $buf;
1206     while (0 < sysread ($reader{$job}, $buf, 8192))
1207     {
1208       print STDERR $buf if $ENV{CRUNCH_DEBUG};
1209       $jobstep[$job]->{stderr} .= $buf;
1210       preprocess_stderr ($job);
1211       if (length ($jobstep[$job]->{stderr}) > 16384)
1212       {
1213         substr ($jobstep[$job]->{stderr}, 0, 8192) = "";
1214       }
1215       $gotsome = 1;
1216     }
1217   }
1218   return $gotsome;
1219 }
1220
1221
1222 sub preprocess_stderr
1223 {
1224   my $job = shift;
1225
1226   while ($jobstep[$job]->{stderr} =~ /^(.*?)\n/) {
1227     my $line = $1;
1228     substr $jobstep[$job]->{stderr}, 0, 1+length($line), "";
1229     Log ($job, "stderr $line");
1230     if ($line =~ /srun: error: (SLURM job $ENV{SLURM_JOB_ID} has expired|Unable to confirm allocation for job $ENV{SLURM_JOB_ID})/) {
1231       # whoa.
1232       $main::please_freeze = 1;
1233     }
1234     elsif ($line =~ /srun: error: (Node failure on|Unable to create job step) /) {
1235       $jobstep[$job]->{node_fail} = 1;
1236       ban_node_by_slot($jobstep[$job]->{slotindex});
1237     }
1238   }
1239 }
1240
1241
1242 sub process_stderr
1243 {
1244   my $job = shift;
1245   my $task_success = shift;
1246   preprocess_stderr ($job);
1247
1248   map {
1249     Log ($job, "stderr $_");
1250   } split ("\n", $jobstep[$job]->{stderr});
1251 }
1252
1253 sub fetch_block
1254 {
1255   my $hash = shift;
1256   my $keep;
1257   if (!open($keep, "-|", "arv-get", "--retries", retry_count(), $hash)) {
1258     Log(undef, "fetch_block run error from arv-get $hash: $!");
1259     return undef;
1260   }
1261   my $output_block = "";
1262   while (1) {
1263     my $buf;
1264     my $bytes = sysread($keep, $buf, 1024 * 1024);
1265     if (!defined $bytes) {
1266       Log(undef, "fetch_block read error from arv-get: $!");
1267       $output_block = undef;
1268       last;
1269     } elsif ($bytes == 0) {
1270       # sysread returns 0 at the end of the pipe.
1271       last;
1272     } else {
1273       # some bytes were read into buf.
1274       $output_block .= $buf;
1275     }
1276   }
1277   close $keep;
1278   if ($?) {
1279     Log(undef, "fetch_block arv-get exited " . exit_status_s($?));
1280     $output_block = undef;
1281   }
1282   return $output_block;
1283 }
1284
1285 # Create a collection by concatenating the output of all tasks (each
1286 # task's output is either a manifest fragment, a locator for a
1287 # manifest fragment stored in Keep, or nothing at all). Return the
1288 # portable_data_hash of the new collection.
1289 sub create_output_collection
1290 {
1291   Log (undef, "collate");
1292
1293   my ($child_out, $child_in);
1294   my $pid = open2($child_out, $child_in, 'python', '-c', q{
1295 import arvados
1296 import sys
1297 print (arvados.api("v1").collections().
1298        create(body={"manifest_text": sys.stdin.read()}).
1299        execute(num_retries=int(sys.argv[1]))["portable_data_hash"])
1300 }, retry_count());
1301
1302   my $task_idx = -1;
1303   my $manifest_size = 0;
1304   for (@jobstep)
1305   {
1306     ++$task_idx;
1307     my $output = $_->{'arvados_task'}->{output};
1308     next if (!defined($output));
1309     my $next_write;
1310     if ($output =~ /^[0-9a-f]{32}(\+\S+)*$/) {
1311       $next_write = fetch_block($output);
1312     } else {
1313       $next_write = $output;
1314     }
1315     if (defined($next_write)) {
1316       if (!defined(syswrite($child_in, $next_write))) {
1317         # There's been an error writing.  Stop the loop.
1318         # We'll log details about the exit code later.
1319         last;
1320       } else {
1321         $manifest_size += length($next_write);
1322       }
1323     } else {
1324       my $uuid = $_->{'arvados_task'}->{'uuid'};
1325       Log (undef, "Error retrieving '$output' output by task $task_idx ($uuid)");
1326       $main::success = 0;
1327     }
1328   }
1329   close($child_in);
1330   Log(undef, "collated output manifest text to send to API server is $manifest_size bytes with access tokens");
1331
1332   my $joboutput;
1333   my $s = IO::Select->new($child_out);
1334   if ($s->can_read(120)) {
1335     sysread($child_out, $joboutput, 1024 * 1024);
1336     waitpid($pid, 0);
1337     if ($?) {
1338       Log(undef, "output collection creation exited " . exit_status_s($?));
1339       $joboutput = undef;
1340     } else {
1341       chomp($joboutput);
1342     }
1343   } else {
1344     Log (undef, "timed out while creating output collection");
1345     foreach my $signal (2, 2, 2, 15, 15, 9) {
1346       kill($signal, $pid);
1347       last if waitpid($pid, WNOHANG) == -1;
1348       sleep(1);
1349     }
1350   }
1351   close($child_out);
1352
1353   return $joboutput;
1354 }
1355
1356
1357 sub killem
1358 {
1359   foreach (@_)
1360   {
1361     my $sig = 2;                # SIGINT first
1362     if (exists $proc{$_}->{"sent_$sig"} &&
1363         time - $proc{$_}->{"sent_$sig"} > 4)
1364     {
1365       $sig = 15;                # SIGTERM if SIGINT doesn't work
1366     }
1367     if (exists $proc{$_}->{"sent_$sig"} &&
1368         time - $proc{$_}->{"sent_$sig"} > 4)
1369     {
1370       $sig = 9;                 # SIGKILL if SIGTERM doesn't work
1371     }
1372     if (!exists $proc{$_}->{"sent_$sig"})
1373     {
1374       Log ($proc{$_}->{jobstep}, "sending 2x signal $sig to pid $_");
1375       kill $sig, $_;
1376       select (undef, undef, undef, 0.1);
1377       if ($sig == 2)
1378       {
1379         kill $sig, $_;     # srun wants two SIGINT to really interrupt
1380       }
1381       $proc{$_}->{"sent_$sig"} = time;
1382       $proc{$_}->{"killedafter"} = time - $proc{$_}->{"time"};
1383     }
1384   }
1385 }
1386
1387
1388 sub fhbits
1389 {
1390   my($bits);
1391   for (@_) {
1392     vec($bits,fileno($_),1) = 1;
1393   }
1394   $bits;
1395 }
1396
1397
1398 # Send log output to Keep via arv-put.
1399 #
1400 # $log_pipe_in and $log_pipe_out are the input and output filehandles to the arv-put pipe.
1401 # $log_pipe_pid is the pid of the arv-put subprocess.
1402 #
1403 # The only functions that should access these variables directly are:
1404 #
1405 # log_writer_start($logfilename)
1406 #     Starts an arv-put pipe, reading data on stdin and writing it to
1407 #     a $logfilename file in an output collection.
1408 #
1409 # log_writer_send($txt)
1410 #     Writes $txt to the output log collection.
1411 #
1412 # log_writer_finish()
1413 #     Closes the arv-put pipe and returns the output that it produces.
1414 #
1415 # log_writer_is_active()
1416 #     Returns a true value if there is currently a live arv-put
1417 #     process, false otherwise.
1418 #
1419 my ($log_pipe_in, $log_pipe_out, $log_pipe_pid);
1420
1421 sub log_writer_start($)
1422 {
1423   my $logfilename = shift;
1424   $log_pipe_pid = open2($log_pipe_out, $log_pipe_in,
1425                         'arv-put',
1426                         '--portable-data-hash',
1427                         '--project-uuid', $Job->{owner_uuid},
1428                         '--retries', '3',
1429                         '--name', $logfilename,
1430                         '--filename', $logfilename,
1431                         '-');
1432 }
1433
1434 sub log_writer_send($)
1435 {
1436   my $txt = shift;
1437   print $log_pipe_in $txt;
1438 }
1439
1440 sub log_writer_finish()
1441 {
1442   return unless $log_pipe_pid;
1443
1444   close($log_pipe_in);
1445   my $arv_put_output;
1446
1447   my $s = IO::Select->new($log_pipe_out);
1448   if ($s->can_read(120)) {
1449     sysread($log_pipe_out, $arv_put_output, 1024);
1450     chomp($arv_put_output);
1451   } else {
1452     Log (undef, "timed out reading from 'arv-put'");
1453   }
1454
1455   waitpid($log_pipe_pid, 0);
1456   $log_pipe_pid = $log_pipe_in = $log_pipe_out = undef;
1457   if ($?) {
1458     Log("log_writer_finish: arv-put exited ".exit_status_s($?))
1459   }
1460
1461   return $arv_put_output;
1462 }
1463
1464 sub log_writer_is_active() {
1465   return $log_pipe_pid;
1466 }
1467
1468 sub Log                         # ($jobstep_id, $logmessage)
1469 {
1470   if ($_[1] =~ /\n/) {
1471     for my $line (split (/\n/, $_[1])) {
1472       Log ($_[0], $line);
1473     }
1474     return;
1475   }
1476   my $fh = select STDERR; $|=1; select $fh;
1477   my $message = sprintf ("%s %d %s %s", $job_id, $$, @_);
1478   $message =~ s{([^ -\176])}{"\\" . sprintf ("%03o", ord($1))}ge;
1479   $message .= "\n";
1480   my $datetime;
1481   if (log_writer_is_active() || -t STDERR) {
1482     my @gmtime = gmtime;
1483     $datetime = sprintf ("%04d-%02d-%02d_%02d:%02d:%02d",
1484                          $gmtime[5]+1900, $gmtime[4]+1, @gmtime[3,2,1,0]);
1485   }
1486   print STDERR ((-t STDERR) ? ($datetime." ".$message) : $message);
1487
1488   if (log_writer_is_active()) {
1489     log_writer_send($datetime . " " . $message);
1490   }
1491 }
1492
1493
1494 sub croak
1495 {
1496   my ($package, $file, $line) = caller;
1497   my $message = "@_ at $file line $line\n";
1498   Log (undef, $message);
1499   freeze() if @jobstep_todo;
1500   create_output_collection() if @jobstep_todo;
1501   cleanup();
1502   save_meta();
1503   die;
1504 }
1505
1506
1507 sub cleanup
1508 {
1509   return unless $Job;
1510   if ($Job->{'state'} eq 'Cancelled') {
1511     $Job->update_attributes('finished_at' => scalar gmtime);
1512   } else {
1513     $Job->update_attributes('state' => 'Failed');
1514   }
1515 }
1516
1517
1518 sub save_meta
1519 {
1520   my $justcheckpoint = shift; # false if this will be the last meta saved
1521   return if $justcheckpoint;  # checkpointing is not relevant post-Warehouse.pm
1522   return unless log_writer_is_active();
1523
1524   my $loglocator = log_writer_finish();
1525   Log (undef, "log manifest is $loglocator");
1526   $Job->{'log'} = $loglocator;
1527   $Job->update_attributes('log', $loglocator);
1528 }
1529
1530
1531 sub freeze_if_want_freeze
1532 {
1533   if ($main::please_freeze)
1534   {
1535     release_allocation();
1536     if (@_)
1537     {
1538       # kill some srun procs before freeze+stop
1539       map { $proc{$_} = {} } @_;
1540       while (%proc)
1541       {
1542         killem (keys %proc);
1543         select (undef, undef, undef, 0.1);
1544         my $died;
1545         while (($died = waitpid (-1, WNOHANG)) > 0)
1546         {
1547           delete $proc{$died};
1548         }
1549       }
1550     }
1551     freeze();
1552     create_output_collection();
1553     cleanup();
1554     save_meta();
1555     exit 1;
1556   }
1557 }
1558
1559
1560 sub freeze
1561 {
1562   Log (undef, "Freeze not implemented");
1563   return;
1564 }
1565
1566
1567 sub thaw
1568 {
1569   croak ("Thaw not implemented");
1570 }
1571
1572
1573 sub freezequote
1574 {
1575   my $s = shift;
1576   $s =~ s/\\/\\\\/g;
1577   $s =~ s/\n/\\n/g;
1578   return $s;
1579 }
1580
1581
1582 sub freezeunquote
1583 {
1584   my $s = shift;
1585   $s =~ s{\\(.)}{$1 eq "n" ? "\n" : $1}ge;
1586   return $s;
1587 }
1588
1589
1590 sub srun
1591 {
1592   my $srunargs = shift;
1593   my $execargs = shift;
1594   my $opts = shift || {};
1595   my $stdin = shift;
1596   my $args = $have_slurm ? [@$srunargs, @$execargs] : $execargs;
1597
1598   $Data::Dumper::Terse = 1;
1599   $Data::Dumper::Indent = 0;
1600   my $show_cmd = Dumper($args);
1601   $show_cmd =~ s/(TOKEN\\*=)[^\s\']+/${1}[...]/g;
1602   $show_cmd =~ s/\n/ /g;
1603   warn "starting: $show_cmd\n";
1604
1605   if (defined $stdin) {
1606     my $child = open STDIN, "-|";
1607     defined $child or die "no fork: $!";
1608     if ($child == 0) {
1609       print $stdin or die $!;
1610       close STDOUT or die $!;
1611       exit 0;
1612     }
1613   }
1614
1615   return system (@$args) if $opts->{fork};
1616
1617   exec @$args;
1618   warn "ENV size is ".length(join(" ",%ENV));
1619   die "exec failed: $!: @$args";
1620 }
1621
1622
1623 sub ban_node_by_slot {
1624   # Don't start any new jobsteps on this node for 60 seconds
1625   my $slotid = shift;
1626   $slot[$slotid]->{node}->{hold_until} = 60 + scalar time;
1627   $slot[$slotid]->{node}->{hold_count}++;
1628   Log (undef, "backing off node " . $slot[$slotid]->{node}->{name} . " for 60 seconds");
1629 }
1630
1631 sub must_lock_now
1632 {
1633   my ($lockfile, $error_message) = @_;
1634   open L, ">", $lockfile or croak("$lockfile: $!");
1635   if (!flock L, LOCK_EX|LOCK_NB) {
1636     croak("Can't lock $lockfile: $error_message\n");
1637   }
1638 }
1639
1640 sub find_docker_image {
1641   # Given a Keep locator, check to see if it contains a Docker image.
1642   # If so, return its stream name and Docker hash.
1643   # If not, return undef for both values.
1644   my $locator = shift;
1645   my ($streamname, $filename);
1646   my $image = api_call("collections/get", uuid => $locator);
1647   if ($image) {
1648     foreach my $line (split(/\n/, $image->{manifest_text})) {
1649       my @tokens = split(/\s+/, $line);
1650       next if (!@tokens);
1651       $streamname = shift(@tokens);
1652       foreach my $filedata (grep(/^\d+:\d+:/, @tokens)) {
1653         if (defined($filename)) {
1654           return (undef, undef);  # More than one file in the Collection.
1655         } else {
1656           $filename = (split(/:/, $filedata, 3))[2];
1657         }
1658       }
1659     }
1660   }
1661   if (defined($filename) and ($filename =~ /^([0-9A-Fa-f]{64})\.tar$/)) {
1662     return ($streamname, $1);
1663   } else {
1664     return (undef, undef);
1665   }
1666 }
1667
1668 sub retry_count {
1669   # Calculate the number of times an operation should be retried,
1670   # assuming exponential backoff, and that we're willing to retry as
1671   # long as tasks have been running.  Enforce a minimum of 3 retries.
1672   my ($starttime, $endtime, $timediff, $retries);
1673   if (@jobstep) {
1674     $starttime = $jobstep[0]->{starttime};
1675     $endtime = $jobstep[-1]->{finishtime};
1676   }
1677   if (!defined($starttime)) {
1678     $timediff = 0;
1679   } elsif (!defined($endtime)) {
1680     $timediff = time - $starttime;
1681   } else {
1682     $timediff = ($endtime - $starttime) - (time - $endtime);
1683   }
1684   if ($timediff > 0) {
1685     $retries = int(log($timediff) / log(2));
1686   } else {
1687     $retries = 1;  # Use the minimum.
1688   }
1689   return ($retries > 3) ? $retries : 3;
1690 }
1691
1692 sub retry_op {
1693   # Pass in two function references.
1694   # This method will be called with the remaining arguments.
1695   # If it dies, retry it with exponential backoff until it succeeds,
1696   # or until the current retry_count is exhausted.  After each failure
1697   # that can be retried, the second function will be called with
1698   # the current try count (0-based), next try time, and error message.
1699   my $operation = shift;
1700   my $retry_callback = shift;
1701   my $retries = retry_count();
1702   foreach my $try_count (0..$retries) {
1703     my $next_try = time + (2 ** $try_count);
1704     my $result = eval { $operation->(@_); };
1705     if (!$@) {
1706       return $result;
1707     } elsif ($try_count < $retries) {
1708       $retry_callback->($try_count, $next_try, $@);
1709       my $sleep_time = $next_try - time;
1710       sleep($sleep_time) if ($sleep_time > 0);
1711     }
1712   }
1713   # Ensure the error message ends in a newline, so Perl doesn't add
1714   # retry_op's line number to it.
1715   chomp($@);
1716   die($@ . "\n");
1717 }
1718
1719 sub api_call {
1720   # Pass in a /-separated API method name, and arguments for it.
1721   # This function will call that method, retrying as needed until
1722   # the current retry_count is exhausted, with a log on the first failure.
1723   my $method_name = shift;
1724   my $log_api_retry = sub {
1725     my ($try_count, $next_try_at, $errmsg) = @_;
1726     $errmsg =~ s/\s*\bat \Q$0\E line \d+\.?\s*//;
1727     $errmsg =~ s/\s/ /g;
1728     $errmsg =~ s/\s+$//;
1729     my $retry_msg;
1730     if ($next_try_at < time) {
1731       $retry_msg = "Retrying.";
1732     } else {
1733       my $next_try_fmt = strftime "%Y-%m-%dT%H:%M:%SZ", gmtime($next_try_at);
1734       $retry_msg = "Retrying at $next_try_fmt.";
1735     }
1736     Log(undef, "API method $method_name failed: $errmsg. $retry_msg");
1737   };
1738   my $method = $arv;
1739   foreach my $key (split(/\//, $method_name)) {
1740     $method = $method->{$key};
1741   }
1742   return retry_op(sub { $method->execute(@_); }, $log_api_retry, @_);
1743 }
1744
1745 sub exit_status_s {
1746   # Given a $?, return a human-readable exit code string like "0" or
1747   # "1" or "0 with signal 1" or "1 with signal 11".
1748   my $exitcode = shift;
1749   my $s = $exitcode >> 8;
1750   if ($exitcode & 0x7f) {
1751     $s .= " with signal " . ($exitcode & 0x7f);
1752   }
1753   if ($exitcode & 0x80) {
1754     $s .= " with core dump";
1755   }
1756   return $s;
1757 }
1758
1759 sub handle_readall {
1760   # Pass in a glob reference to a file handle.
1761   # Read all its contents and return them as a string.
1762   my $fh_glob_ref = shift;
1763   local $/ = undef;
1764   return <$fh_glob_ref>;
1765 }
1766
1767 sub tar_filename_n {
1768   my $n = shift;
1769   return sprintf("%s/git.%s.%d.tar", $ENV{CRUNCH_TMP}, $job_id, $n);
1770 }
1771
1772 sub add_git_archive {
1773   # Pass in a git archive command as a string or list, a la system().
1774   # This method will save its output to be included in the archive sent to the
1775   # build script.
1776   my $git_input;
1777   $git_tar_count++;
1778   if (!open(GIT_ARCHIVE, ">", tar_filename_n($git_tar_count))) {
1779     croak("Failed to save git archive: $!");
1780   }
1781   my $git_pid = open2(">&GIT_ARCHIVE", $git_input, @_);
1782   close($git_input);
1783   waitpid($git_pid, 0);
1784   close(GIT_ARCHIVE);
1785   if ($?) {
1786     croak("Failed to save git archive: git exited " . exit_status_s($?));
1787   }
1788 }
1789
1790 sub combined_git_archive {
1791   # Combine all saved tar archives into a single archive, then return its
1792   # contents in a string.  Return undef if no archives have been saved.
1793   if ($git_tar_count < 1) {
1794     return undef;
1795   }
1796   my $base_tar_name = tar_filename_n(1);
1797   foreach my $tar_to_append (map { tar_filename_n($_); } (2..$git_tar_count)) {
1798     my $tar_exit = system("tar", "-Af", $base_tar_name, $tar_to_append);
1799     if ($tar_exit != 0) {
1800       croak("Error preparing build archive: tar -A exited " .
1801             exit_status_s($tar_exit));
1802     }
1803   }
1804   if (!open(GIT_TAR, "<", $base_tar_name)) {
1805     croak("Could not open build archive: $!");
1806   }
1807   my $tar_contents = handle_readall(\*GIT_TAR);
1808   close(GIT_TAR);
1809   return $tar_contents;
1810 }
1811
1812 __DATA__
1813 #!/usr/bin/perl
1814 #
1815 # This is crunch-job's internal dispatch script.  crunch-job running on the API
1816 # server invokes this script on individual compute nodes, or localhost if we're
1817 # running a job locally.  It gets called in two modes:
1818 #
1819 # * No arguments: Installation mode.  Read a tar archive from the DATA
1820 #   file handle; it includes the Crunch script's source code, and
1821 #   maybe SDKs as well.  Those should be installed in the proper
1822 #   locations.  This runs outside of any Docker container, so don't try to
1823 #   introspect Crunch's runtime environment.
1824 #
1825 # * With arguments: Crunch script run mode.  This script should set up the
1826 #   environment, then run the command specified in the arguments.  This runs
1827 #   inside any Docker container.
1828
1829 use Fcntl ':flock';
1830 use File::Path qw( make_path remove_tree );
1831 use POSIX qw(getcwd);
1832
1833 # Map SDK subdirectories to the path environments they belong to.
1834 my %SDK_ENVVARS = ("perl/lib" => "PERLLIB", "ruby/lib" => "RUBYLIB");
1835
1836 my $destdir = $ENV{"CRUNCH_SRC"};
1837 my $commit = $ENV{"CRUNCH_SRC_COMMIT"};
1838 my $repo = $ENV{"CRUNCH_SRC_URL"};
1839 my $install_dir = $ENV{"CRUNCH_INSTALL"} || (getcwd() . "/opt");
1840 my $job_work = $ENV{"JOB_WORK"};
1841 my $task_work = $ENV{"TASK_WORK"};
1842
1843 for my $dir ($destdir, $job_work, $task_work) {
1844   if ($dir) {
1845     make_path $dir;
1846     -e $dir or die "Failed to create temporary directory ($dir): $!";
1847   }
1848 }
1849
1850 if ($task_work) {
1851   remove_tree($task_work, {keep_root => 1});
1852 }
1853
1854 open(STDOUT_ORIG, ">&", STDOUT);
1855 open(STDERR_ORIG, ">&", STDERR);
1856 open(STDOUT, ">>", "$destdir.log");
1857 open(STDERR, ">&", STDOUT);
1858
1859 ### Crunch script run mode
1860 if (@ARGV) {
1861   # We want to do routine logging during task 0 only.  This gives the user
1862   # the information they need, but avoids repeating the information for every
1863   # task.
1864   my $Log;
1865   if ($ENV{TASK_SEQUENCE} eq "0") {
1866     $Log = sub {
1867       my $msg = shift;
1868       printf STDERR_ORIG "[Crunch] $msg\n", @_;
1869     };
1870   } else {
1871     $Log = sub { };
1872   }
1873
1874   my $python_src = "$install_dir/python";
1875   my $venv_dir = "$job_work/.arvados.venv";
1876   my $venv_built = -e "$venv_dir/bin/activate";
1877   if ((!$venv_built) and (-d $python_src) and can_run("virtualenv")) {
1878     shell_or_die("virtualenv", "--quiet", "--system-site-packages",
1879                  "--python=python2.7", $venv_dir);
1880     shell_or_die("$venv_dir/bin/pip", "--quiet", "install", "-I", $python_src);
1881     $venv_built = 1;
1882     $Log->("Built Python SDK virtualenv");
1883   }
1884
1885   my $pip_bin = "pip";
1886   if ($venv_built) {
1887     $Log->("Running in Python SDK virtualenv");
1888     $pip_bin = "$venv_dir/bin/pip";
1889     my $orig_argv = join(" ", map { quotemeta($_); } @ARGV);
1890     @ARGV = ("/bin/sh", "-ec",
1891              ". \Q$venv_dir/bin/activate\E; exec $orig_argv");
1892   } elsif (-d $python_src) {
1893     $Log->("Warning: virtualenv not found inside Docker container default " .
1894            "\$PATH. Can't install Python SDK.");
1895   }
1896
1897   my $pkgs = `(\Q$pip_bin\E freeze 2>/dev/null | grep arvados) || dpkg-query --show '*arvados*'`;
1898   if ($pkgs) {
1899     $Log->("Using Arvados SDK:");
1900     foreach my $line (split /\n/, $pkgs) {
1901       $Log->($line);
1902     }
1903   } else {
1904     $Log->("Arvados SDK packages not found");
1905   }
1906
1907   while (my ($sdk_dir, $sdk_envkey) = each(%SDK_ENVVARS)) {
1908     my $sdk_path = "$install_dir/$sdk_dir";
1909     if (-d $sdk_path) {
1910       if ($ENV{$sdk_envkey}) {
1911         $ENV{$sdk_envkey} = "$sdk_path:" . $ENV{$sdk_envkey};
1912       } else {
1913         $ENV{$sdk_envkey} = $sdk_path;
1914       }
1915       $Log->("Arvados SDK added to %s", $sdk_envkey);
1916     }
1917   }
1918
1919   close(STDOUT);
1920   close(STDERR);
1921   open(STDOUT, ">&", STDOUT_ORIG);
1922   open(STDERR, ">&", STDERR_ORIG);
1923   exec(@ARGV);
1924   die "Cannot exec `@ARGV`: $!";
1925 }
1926
1927 ### Installation mode
1928 open L, ">", "$destdir.lock" or die "$destdir.lock: $!";
1929 flock L, LOCK_EX;
1930 if (readlink ("$destdir.commit") eq $commit && -d $destdir) {
1931   # This version already installed -> nothing to do.
1932   exit(0);
1933 }
1934
1935 unlink "$destdir.commit";
1936 mkdir $destdir;
1937
1938 if (!open(TARX, "|-", "tar", "-xC", $destdir)) {
1939   die "Error launching 'tar -xC $destdir': $!";
1940 }
1941 # If we send too much data to tar in one write (> 4-5 MiB), it stops, and we
1942 # get SIGPIPE.  We must feed it data incrementally.
1943 my $tar_input;
1944 while (read(DATA, $tar_input, 65536)) {
1945   print TARX $tar_input;
1946 }
1947 if(!close(TARX)) {
1948   die "'tar -xC $destdir' exited $?: $!";
1949 }
1950
1951 mkdir $install_dir;
1952
1953 my $sdk_root = "$destdir/.arvados.sdk/sdk";
1954 if (-d $sdk_root) {
1955   foreach my $sdk_lang (("python",
1956                          map { (split /\//, $_, 2)[0]; } keys(%SDK_ENVVARS))) {
1957     if (-d "$sdk_root/$sdk_lang") {
1958       if (!rename("$sdk_root/$sdk_lang", "$install_dir/$sdk_lang")) {
1959         die "Failed to install $sdk_lang SDK: $!";
1960       }
1961     }
1962   }
1963 }
1964
1965 my $python_dir = "$install_dir/python";
1966 if ((-d $python_dir) and can_run("python2.7") and
1967     (system("python2.7", "$python_dir/setup.py", "--quiet", "egg_info") != 0)) {
1968   # egg_info failed, probably when it asked git for a build tag.
1969   # Specify no build tag.
1970   open(my $pysdk_cfg, ">>", "$python_dir/setup.cfg");
1971   print $pysdk_cfg "\n[egg_info]\ntag_build =\n";
1972   close($pysdk_cfg);
1973 }
1974
1975 if (-e "$destdir/crunch_scripts/install") {
1976     shell_or_die ("$destdir/crunch_scripts/install", $install_dir);
1977 } elsif (!-e "./install.sh" && -e "./tests/autotests.sh") {
1978     # Old version
1979     shell_or_die ("./tests/autotests.sh", $install_dir);
1980 } elsif (-e "./install.sh") {
1981     shell_or_die ("./install.sh", $install_dir);
1982 }
1983
1984 if ($commit) {
1985     unlink "$destdir.commit.new";
1986     symlink ($commit, "$destdir.commit.new") or die "$destdir.commit.new: $!";
1987     rename ("$destdir.commit.new", "$destdir.commit") or die "$destdir.commit: $!";
1988 }
1989
1990 close L;
1991
1992 sub can_run {
1993   my $command_name = shift;
1994   open(my $which, "-|", "which", $command_name);
1995   while (<$which>) { }
1996   close($which);
1997   return ($? == 0);
1998 }
1999
2000 sub shell_or_die
2001 {
2002   if ($ENV{"DEBUG"}) {
2003     print STDERR "@_\n";
2004   }
2005   if (system (@_) != 0) {
2006     my $err = $!;
2007     my $exitstatus = sprintf("exit %d signal %d", $? >> 8, $? & 0x7f);
2008     open STDERR, ">&STDERR_ORIG";
2009     system ("cat $destdir.log >&2");
2010     die "@_ failed ($err): $exitstatus";
2011   }
2012 }
2013
2014 __DATA__