MaxQuant-ohjelmiston käyttäminen Puhti-superkoneella
MaxQuant on kvantitatiivinen proteomiikkasovelluspaketti, joka on suunniteltu suurten massaspektrometristen tietojoukkojen analysointiin. Suorituskykyinen laskentaympäristö, kuten Puhti, soveltuu laskentaintensiivisten tehtävien suorittamiseen MaxQuant-ohjelmiston avulla proteomiikan tutkimuksessa.
MaxQuant on ilmainen käyttää, mutta jokaisen käyttäjän on rekisteröidyttävä ja ladattava MaxQuant itse kehittäjän sivustolta.
Tässä ohjeessa annetaan ohjeet MaxQuant-ohjelmiston suorittamiseen Puhtilla.
Parametritiedoston konfigurointi
Vaikka aiot suorittaa MaxQuant-putkiston Puhtilla, sinun on ensin konfiguroitava MaxQuant-työsi eri parametrit paikallisella Windows-koneellasi. Sen jälkeen lataa parametridata (eli mqpar.xml
), raakatiedsätä (esim. .raw tiedostot) ja sekvenssitiedosto (eli .fasta tiedosto) Puhti-laskentaympäristöön.
XML-konfigurointitiedoston muokkaaminen
Sinun on tehtävä joitain muutoksia parametridataasi (mqpar.xml
), joka esimerkiksi luotiin paikallisella Windows-koneella, jotta se olisi yhteensopiva HPC-ympäristön kanssa.
Näihin muutoksiin kuuluu:
- Windows-polkujen muuttaminen linux-polkuiksi näytetiedostoille (vinkki: etsi
<filePaths>
XML-tiedostosta) - Windows-polun muuttaminen linux-poluksi fasta-sekvenssitiedostolle (vinkki: etsi
<fastaFilePath>
XML-tiedostosta) - Säikeiden lukumäärä näytteiden määrän mukaan (vinkki: etsi
<numThreads>
XML-tiedostosta)
Lähettäminen erätyöksi Puhti-keskuksessa
-
Kirjaudu ensin Puhti-koneeseen (katso ohjeet täältä)
-
Vaihda projektihakemistoon Puhtilla ja kopioi syötetiedostosi sinne (vinkkejä tiedostonsiirrosta).
Tämä on projektihakemistosi (scratchissa), jossa .xml-tiedostosi, .fasta-tiedostosi ja raakatiedostosi sijaitsevat
- Opi ottamaan käyttöön MaxQuant-ympäristö
MaxQuant-ohjelmisto tarvitsee myös mono-ohjelmiston toimiakseen. Mono-ohjelmistolla voit valita MaxQuant-versiosi. CSC tarjoaa modulin mono:lle.
Lataa linux-yhteensopiva versiosi MaxQuantista (esim. v2.0.3.0) scratch-hakemistoosi Puhtilla ja suorita seuraava varmistaaksesi, että MaxQuant on asennettu oikein:
Huomaa, että hakemiston nimi sisältää välilyönnin, joten sinun on joko käytettävä kenoviivaa () tai ympäröitävä polku lainausmerkeillä. Helppouden vuoksi saatat haluta nimetä hakemiston niin, että siinä on esim. alaviiva välilyönnin sijasta.
Huomio
Huomaa, että MaxQuant-versio, jota käytit .xml-parametrikonfiguraatiotiedoston luomiseen, on vastattava sitä versiota, jota käytät Linux-ympäristössä, jotta se sujuu kyseisessä klusteriympäristössä. Muut uusimmat versiot voivat toimia.
- Lähetä lopuksi skriptisi
Luo erätyöskripti jaetun muistin töiden ohjeiden mukaisesti ja varmista, että skripti päätyy samaan hakemistoon kuin missä mqpar.xml
- ja muut tietotiedostosi sijaitsevat.
Helpottaaksesi erätyöskriptin kirjoittamista, voit käyttää seuraavaa vähimmäisesimerkkiskriptiä (kutsutaan esim. maxquant.sh
), alustana:
#!/bin/bash
#SBATCH --job-name=maxquant
#SBATCH --output=output_%j.txt
#SBATCH --error=errors_%j.txt
#SBATCH --account=project_xxx
#SBATCH --time=01:20:00
#SBATCH --ntasks=1
#SBATCH --partition=small
#SBATCH --cpus-per-task=6
#SBATCH --mem=16000
# lataa maxquant-ympäristö
module load mono/5.14
# säädä tiedostopolut täällä
mono /path_of_MaxQuant/bin/MaxQuantCmd.exe /path/MaxQuant/mqpar.xml
ja muuta sitten resurssivarauksia näytteiden määrän mukaan. Lähetä skriptisi alla:
Kun maxquant
-tehtävä on valmis, tulostiedostosi ovat tässä samassa hakemistossa.
Tutorista esimerkki
Voit ladata esimerkkejä tutorista aineistosta MaxQuant-käyttöön alla:
ja pura sitten ladattu arkistotiedosto alla:
Opastus sisältää esimerkkiraakatiestoiminnan ja muut tarvittavat tiedostot MaxQuantin ajamiseen testattavaksi.
Tarkista käytetyt resurssit, kun tehtäväsi on valmis
Kun maxquant
-tehtävä on valmis, voit tarkistaa tietojenkäsittelyresurssien käytön, kuten muistin ja CPU:n käytön tehokkuuden. Tämä auttaa sinua hienosäätämään paremmin parametreja tehokasta tietojenkäsittelyresurssien käyttöä varten.
Voit käyttää seuraavia komentoja työnumeron avulla: