mojaveazure / angsd-wrapper Arkistoitu

HUOMAUTUS: Uusin versio ANGSD-wrapperista on osoitteessa ANGSD-wrapper/angsd-wrapper

Tässä arkistossa oleva versio ei ole enää ajan tasalla, siirry yllä linkitettyyn versioon.

ANGSD-wrapper on apuohjelma, joka on kehitetty apuvälineeksi seuraavan sukupolven sekvensointidatan analysointiin. Käyttäjät voivat tehdä tämän paketin avulla seuraavaa:

  • Laskenta paikkataajuusspektri
  • Laskenta 2D-paikkataajuusspektri ja vastaavat FST-estimaatit
  • Toteuttaa ABBA/BABA-testejä
  • .

  • Extraktoi FASTA-sekvenssi BAM-tiedostoista
  • Laskekaa genotyyppien todennäköisyydet
  • Estimoi Thetat ja erilaiset neutraliteettitilastot
  • Laskekaa per…individual inbreeding coefficient
  • Find admixture proportions

Likelihood-pohjaisia lähestymistapoja käytetään ANGSD:ssä yhteenvetotilastojen laskemiseen seuraavan sukupolven sekvensointidatasta. Wrapper-skriptit ja dokumentaatio on suunniteltu tekemään ANGSD:stä käyttäjäystävällinen.

ANGSD-wrapperin asentaminen

Asenna ANGSD-wrapper, lataa GitHubista

git clone https://github.com/mojaveazure/angsd-wrapper.git

Mene ANGSD-wrapper-hakemistoon

cd angsd-wrapper/

Suorita asennuskomento

./angsd-wrapper setup dependencies

Lataa esimerkkitietokanta (valinnainen)

./angsd-wrapper setup data

Suorita asennus loppuun

source ~/.bash_profile

Huomioitavaa BAM-tiedostoista

ANGSD vaatii syötteenä BAM-tiedostoja, ja ANGSD-wrapper välittää ANGSD:lle luettelon BAM-tiedostoista. Näillä BAM-tiedostoilla on muutama vaatimus:

  • BAM-tiedostoissa on oltava ’@HD’-otsikkorivi
  • BAM-tiedostojen on oltava indeksoituja (.bai)

Katsoaksesi, onko BAM-tiedostoissa ’@HD’-otsikkorivi, suorita näyteluettelollesi seuraava:

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

Jos jokin näytteistä alkaa kirjaimella ’@SQ’ eikä kirjaimella ’@HD’, ANGSD ja ANGSD-wrapper epäonnistuvat. Tämä Gist lisää @HD otsikkorivit BAM-tiedostoihisi.

Index-tiedostot on luotava BAM-tiedostojen jälkeen. Jos haluat indeksoida BAM-tiedostot SAMToolsin avulla, suorita näyteluettelossasi seuraava:

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

Jos järjestelmääsi on asennettu GNU Parallel, tämä prosessi voi nopeutua:

cat ~/path/to/sample_list.txt | parallel samtools index {}

Peruskäyttö

Käyttääksesi ANGSD-wrapperia, suorita

angsd-wrapper <wrapper> <config>

Missä wrapper on yksi menetelmistä, joita ANGSD-wrapper voi suorittaa, ja config on suhteellinen polku vastaavaan konfiguraatiotiedostoon.

Luettelon käytettävissä olevista kääreistä näet ajamalla

angsd-wrapper

Konfiguraatiotiedostot

Kullekin metodille on konfiguraatiotiedosto (config-tiedosto), joka on käytettävissä angsd-wrapper. kautta angsd-wrapper. Konfiguraatiotiedostot pitävät sisällään kääreiden käyttämiä muuttujia. Täällä sinun on muutettava ja tallennettava muuttujia (esim. määritettävä indeksoitujen BAM-tiedostojen/CRAM-tiedostojen, FASTA-tiedostojen, näyteluetteloiden jne. tiedostopolut) näytteillesi sopiviksi ennen angsd-wrapperin suorittamista määritetyllä menetelmällä.

Vakiomuotoiset konfigurointitiedostot löytyvät Configuration_Files-hakemistosta. Sinun on muutettava niitä näytteillesi sopiviksi. Katso config-tiedostoista tai wikistä, mihin kutakin muuttujaa käytetään ja miten ne tulisi määrittää. Jos suoritat angsd-wrapper ilman argumentteja, se palauttaa käyttöviestin.

Esimerkkien konfigurointitiedostot löytyvät Example_Data/Configuration_Files:stä, kun suoritat angsd-wrapper setup data.

Lisätietoa

Lisätietoa ANGSD-wrapperista, ANGSD-wrapperin kautta käytettävissä olevista metodeista ja kattavasta tutoriaalista löydät wikistä.

Riippuvuudet

Tämä paketti vaatii seuraavat riippuvuudet:

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

Nämä ladataan ja asennetaan automaattisesti, kun angsd-wrapper asennetaan

On muutama muukin riippuvuuspaketti, joita ei automaattisesti ladata asennuksen yhteydessä:

  • SAMTools
  • GNU Scientific Library
  • Git
  • Wget

Tuetut menetelmät

  • Sivuston taajuusspektri (SFS)
  • Thetas-estimoinnit
  • 2D-suorituskykyinen SFS-laskentajärjestelmä ja FST-laskentamenetelmäli-laskentamenetelmä-laskentamenetelmä
  • .

  • ABBA/BABA
  • Ancestral sequence extractions
  • Genotype likelihood estimations
  • Inbreeding coefficients calculations
  • Principal component analysis
  • Admixture analysis

Citing ANGSD-wrapper

ANGSD-wrapper julkaistiin Molecular Ecology Resources -lehdessä; jos käytät sitä työssäsi, siteeraa artikkelia. BibTeX-käyttäjille viittaus on seuraava:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

Jätä kommentti