Переход на Slurm

Краткая инструкция для перехода на новую систему Slurm #

Параметры в скриптах #

Torque Slurm
#PBS -N myjob #SBATCH --job-name=myjob
#PBS -l walltime=1:00:00 #SBATCH --time=1:00:00
#PBS -l nodes=N:ppn=M #SBATCH --nodes=N --ntasks-per-node=M
#PBS -l mem=Xgb #SBATCH --mem=Xgb
#PBS -l pmem=Xgb #SBATCH --mem-per-cpu=Xgb
#PBS -q queue #SBATCH --partition queue
mpiexec mpirun

Команды #

Torque Slurm
qsub <jobscript> sbatch <jobscript>
qdel <jobid> scancel <jobid>
qhold <jobid> scontrol hold <jobid>
qrls <jobid> scontrol release <jobid>
qstat -u <user> squeue -u <user>
pbstop slurmtop

Важные отличия #

Первая строка в скрипте для Slurm должна иметь вид #!<shell>, например:

#!/bin/bash

Задачи в Slurm запускаются из текущей директории, а не из домашней.

Вывод stdout и stderr по умолчанию объединяется в один файл.

При запуске MPI задач вместо mpiexec надо использовать mpirun.

Для запуска интерактивных задач можно использовать команду srun --pty, например:

srun --pty -p mix --ntasks=8 --time=1:00:00 /bin/bash

Поддержка старых команд #

На узле h1 установлены команды qsub, qinfo и прочие, которые могут быть использованы для запуска старых Torque скриптов в системе Slurm.

Возможности этих команд ограничены, и они работают только в простых случаях. Рекомендуется перейти на оригинальные команды и параметры Slurm.