Обновления в январе 2023

Обновления в январе 2023

2023-01-10

В первой декаде января 2023 года на кластере произошли значительные изменения, которые могут прямо или косвенно затронуть некоторых пользователей. Если у вас возникли проблемы, ознакомьтесь со списком изменений ниже, а также с другими страницами на этом сайте. Если вы не смогли найти решение, обратитесь к администраторам кластера за советом.

  1. Операционная система на всех узлах обновлена до SUSE Linux Enterprise High Performance Computing 15 SP4 (ранее на головном узле была версия 15 SP3, на вычислительных – 15 SP2).
  2. Система очередей Slurm обновлена с версии 20.02 до 22.05. Наиболее заметные для пользователей изменения включают:
    • Для интерактивного запуска задач вместо srun --pty ... /bin/bash теперь нужно использовать salloc ..., например: salloc --ntasks=8 --time=1:00:00.
    • Появилась возможность ставить задачи в очередь по расписанию с помощью scrontab.
    • Новый параметр --prefer позволяет указать желаемый список узлов, но задача может быть запущена и на других узлах, если желаемые узлы заняты.
  3. Вычислительные узлы переименованы, и теперь имеют простые имена от n01 до n36.
  4. Установлены новые версии компиляторов Intel oneAPI. По умолчанию при загрузке модулей intel используются именно новые версии. Для использования старых версий явно указывайте номер версии, например: module load intel/19.1.3.304 impi/2019.9.304.
  5. Очереди задач x20core, mix, long и другие удалены. Доступна только очередь normal.
  6. Максимальный лимит времени на задачу теперь зависит от количества используемых узлов. Например, задача с одним узлом может выполняться 7 дней, а задача с 36 узлами только 12 часов. Подробнее на странице.
  7. Старые команды Torque (qsub, qstat и др.) более недоступны.