Hyppää sisältöön

Significant changes to Puhti & Mahti authentication coming in April! Read about the SSH key and multi-factor authentication requirements.

Miksi eräajoni epäonnistuu?

Alla on yleisiä virheilmoituksia, joita saatat kohdata eräajon epäonnistuessa, sekä neuvoja niiden korjaamiseksi.

Virheellinen tili tai tili/osa-yhdistelmä määritelty

Täydellinen virheilmoitus on seuraava:

sbatch: error: Batch job submission failed: Invalid account or account/partition combination specified

Tämä virheilmoitus viittaa Slurm-valintoihin --account=<project> ja --partition. Yleisimmät syyt ovat:

Työ rikkoo laskutuksen/QOS-käytäntöä

Täydellinen virheilmoitus on seuraava:

sbatch: error: AssocMaxSubmitJobLimit
sbatch: error: Batch job submission failed: Job violates accounting/QOS policy (job submit limit, user's size and/or time limits)

Yleisimmät syyt ovat:

  • Työskriptistä puuttuu --account-parametri.
  • Projektilasi sisältää liikaa töitä järjestelmässä, joko suoritettavana tai jonossa. Huomaa, että sisäisesti Slurm laskee jokaisen työn eräajotyössä erilliseksi työksi.
  • Työ suoritettiin suoraan ./script_name.sh tai bash script_name.sh komennolla, kun se tulisi lähettää sbatch script_name.sh komennolla.
  • Projektisi on käyttänyt loppuun laskutusyksikkönsä. Katso Kuinka hakea lisää laskutusyksiköitä.

Pyydetty solmukonfiguraatio ei ole saatavilla

Täydellinen virheilmoitus on seuraava:

sbatch: error: Batch job submission failed: Requested node configuration is not available

Yleisimmät syyt ovat:

  • Pyydetään esimerkiksi GPU:ta tai NVMe:ä osassa, jossa niitä ei ole.
  • Pyydetään esimerkiksi enemmän muistia tai aikaa kuin valittu osuus voi tarjota. Erityisesti käytettäessä --mem-per-cpu-lippua muistin määrittämiseksi, huomaa, että tämä kerrotaan pyydettyjen suoritun määrä (1 tehtävää kohden) ja tuloksen on oltava valitun osuus rajojen sisällä.

Katso eräajojen osat saadaksesi lisätietoa resurssien saatavuudesta kussakin jonossa.