8203/8690: crunch-job uses `srun --nodes=1`.
authorBrett Smith <brett@curoverse.com>
Tue, 15 Mar 2016 01:05:17 +0000 (21:05 -0400)
committerBrett Smith <brett@curoverse.com>
Tue, 15 Mar 2016 01:05:17 +0000 (21:05 -0400)
commit301d6e0468f5dcda1443f6a38a51540e998e2079
tree4b6a53a43d1db1d152d6e28aa2cb0446b5f76d3a
parent2324d45d702c454057558919be2f598f416e9f91
8203/8690: crunch-job uses `srun --nodes=1`.

Using `srun --nodelist=[one node]` is not sufficient to ensure that
the command runs on a single node; only that it will at least be
allocated the requested node.  This is documented in the srun man
page, and we've observed additional node allocations in these calls.
When srun allocates additional nodes to the work, this can break later
parsing code in crunch-job.

Prefer --nodes, which sets a hard maximum on the number of nodes used.
We're already using this to run individual tasks (-N1), so it's a
known strategy.  Tested live before pushing.  Refs #8203, #8690.
sdk/cli/bin/crunch-job