HUOMAUTUS: Uusin versio ANGSD-wrapperista on osoitteessa ANGSD-wrapper/angsd-wrapper
Tässä arkistossa oleva versio ei ole enää ajan tasalla, siirry yllä linkitettyyn versioon.
ANGSD-wrapper on apuohjelma, joka on kehitetty apuvälineeksi seuraavan sukupolven sekvensointidatan analysointiin. Käyttäjät voivat tehdä tämän paketin avulla seuraavaa:
- Laskenta paikkataajuusspektri
- Laskenta 2D-paikkataajuusspektri ja vastaavat FST-estimaatit
- Toteuttaa ABBA/BABA-testejä
- Extraktoi FASTA-sekvenssi BAM-tiedostoista
- Laskekaa genotyyppien todennäköisyydet
- Estimoi Thetat ja erilaiset neutraliteettitilastot
- Laskekaa per…individual inbreeding coefficient
- Find admixture proportions
.
Likelihood-pohjaisia lähestymistapoja käytetään ANGSD:ssä yhteenvetotilastojen laskemiseen seuraavan sukupolven sekvensointidatasta. Wrapper-skriptit ja dokumentaatio on suunniteltu tekemään ANGSD:stä käyttäjäystävällinen.
ANGSD-wrapperin asentaminen
Asenna ANGSD-wrapper, lataa GitHubista
git clone https://github.com/mojaveazure/angsd-wrapper.git
Mene ANGSD-wrapper-hakemistoon
cd angsd-wrapper/
Suorita asennuskomento
./angsd-wrapper setup dependencies
Lataa esimerkkitietokanta (valinnainen)
./angsd-wrapper setup data
Suorita asennus loppuun
source ~/.bash_profile
Huomioitavaa BAM-tiedostoista
ANGSD vaatii syötteenä BAM-tiedostoja, ja ANGSD-wrapper välittää ANGSD:lle luettelon BAM-tiedostoista. Näillä BAM-tiedostoilla on muutama vaatimus:
- BAM-tiedostoissa on oltava ’@HD’-otsikkorivi
- BAM-tiedostojen on oltava indeksoituja (.bai)
Katsoaksesi, onko BAM-tiedostoissa ’@HD’-otsikkorivi, suorita näyteluettelollesi seuraava:
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
Jos jokin näytteistä alkaa kirjaimella ’@SQ’ eikä kirjaimella ’@HD’, ANGSD ja ANGSD-wrapper epäonnistuvat. Tämä Gist lisää @HD
otsikkorivit BAM-tiedostoihisi.
Index-tiedostot on luotava BAM-tiedostojen jälkeen. Jos haluat indeksoida BAM-tiedostot SAMToolsin avulla, suorita näyteluettelossasi seuraava:
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
Jos järjestelmääsi on asennettu GNU Parallel, tämä prosessi voi nopeutua:
cat ~/path/to/sample_list.txt | parallel samtools index {}
Peruskäyttö
Käyttääksesi ANGSD-wrapperia, suorita
angsd-wrapper <wrapper> <config>
Missä wrapper
on yksi menetelmistä, joita ANGSD-wrapper voi suorittaa, ja config
on suhteellinen polku vastaavaan konfiguraatiotiedostoon.
Luettelon käytettävissä olevista kääreistä näet ajamalla
angsd-wrapper
Konfiguraatiotiedostot
Kullekin metodille on konfiguraatiotiedosto (config-tiedosto), joka on käytettävissä angsd-wrapper.
kautta angsd-wrapper.
Konfiguraatiotiedostot pitävät sisällään kääreiden käyttämiä muuttujia. Täällä sinun on muutettava ja tallennettava muuttujia (esim. määritettävä indeksoitujen BAM-tiedostojen/CRAM-tiedostojen, FASTA-tiedostojen, näyteluetteloiden jne. tiedostopolut) näytteillesi sopiviksi ennen angsd-wrapperin suorittamista määritetyllä menetelmällä.
Vakiomuotoiset konfigurointitiedostot löytyvät Configuration_Files
-hakemistosta. Sinun on muutettava niitä näytteillesi sopiviksi. Katso config-tiedostoista tai wikistä, mihin kutakin muuttujaa käytetään ja miten ne tulisi määrittää. Jos suoritat angsd-wrapper
ilman argumentteja, se palauttaa käyttöviestin.
Esimerkkien konfigurointitiedostot löytyvät Example_Data/Configuration_Files
:stä, kun suoritat angsd-wrapper setup data
.
Lisätietoa
Lisätietoa ANGSD-wrapperista, ANGSD-wrapperin kautta käytettävissä olevista metodeista ja kattavasta tutoriaalista löydät wikistä.
Riippuvuudet
Tämä paketti vaatii seuraavat riippuvuudet:
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
Nämä ladataan ja asennetaan automaattisesti, kun angsd-wrapper asennetaan
On muutama muukin riippuvuuspaketti, joita ei automaattisesti ladata asennuksen yhteydessä:
- SAMTools
- GNU Scientific Library
- Git
- Wget
Tuetut menetelmät
- Sivuston taajuusspektri (SFS)
- Thetas-estimoinnit
- 2D-suorituskykyinen SFS-laskentajärjestelmä ja FST-laskentamenetelmäli-laskentamenetelmä-laskentamenetelmä
- ABBA/BABA
- Ancestral sequence extractions
- Genotype likelihood estimations
- Inbreeding coefficients calculations
- Principal component analysis
- Admixture analysis
.
Citing ANGSD-wrapper
ANGSD-wrapper julkaistiin Molecular Ecology Resources -lehdessä; jos käytät sitä työssäsi, siteeraa artikkelia. BibTeX-käyttäjille viittaus on seuraava:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}