Miksi eräajoni epäonnistuu?
Alla on yleisiä virheilmoituksia, joita saatat kohdata eräajon epäonnistuessa, sekä neuvoja niiden korjaamiseksi.
Virheellinen tili tai tili/osa-yhdistelmä määritelty
Täydellinen virheilmoitus on seuraava:
sbatch: error: Batch job submission failed: Invalid account or account/partition combination specified
Tämä virheilmoitus viittaa Slurm-valintoihin --account=<project>
ja --partition
. Yleisimmät syyt ovat:
- Projektia ei ole olemassa.
- Projekti on olemassa, mutta et ole sen jäsen. Katso, kuinka lisätä jäsen projektiin
- Olet projektin jäsen, mutta projektia ei ole otettu käyttöön Puhti-alustalla. Katso kuinka lisätä palvelun käyttöoikeus projektille.
- Osa ei ole olemassa.
- Osa on olemassa, mutta projektisi ei ole sallittu siinä.
Työ rikkoo laskutuksen/QOS-käytäntöä
Täydellinen virheilmoitus on seuraava:
sbatch: error: AssocMaxSubmitJobLimit
sbatch: error: Batch job submission failed: Job violates accounting/QOS policy (job submit limit, user's size and/or time limits)
Yleisimmät syyt ovat:
- Työskriptistä puuttuu
--account
-parametri. - Projektilasi sisältää liikaa töitä järjestelmässä, joko suoritettavana tai jonossa. Huomaa, että sisäisesti Slurm laskee jokaisen työn eräajotyössä erilliseksi työksi.
- Työ suoritettiin suoraan
./script_name.sh
taibash script_name.sh
komennolla, kun se tulisi lähettääsbatch script_name.sh
komennolla. - Projektisi on käyttänyt loppuun laskutusyksikkönsä. Katso Kuinka hakea lisää laskutusyksiköitä.
Pyydetty solmukonfiguraatio ei ole saatavilla
Täydellinen virheilmoitus on seuraava:
Yleisimmät syyt ovat:
- Pyydetään esimerkiksi GPU:ta tai NVMe:ä osassa, jossa niitä ei ole.
- Pyydetään esimerkiksi enemmän muistia tai aikaa kuin valittu osuus voi tarjota. Erityisesti
käytettäessä
--mem-per-cpu
-lippua muistin määrittämiseksi, huomaa, että tämä kerrotaan pyydettyjen suoritun määrä (1 tehtävää kohden) ja tuloksen on oltava valitun osuus rajojen sisällä.
Katso eräajojen osat saadaksesi lisätietoa resurssien saatavuudesta kussakin jonossa.