NOTĂ: Cea mai recentă versiune a ANGSD-wrapper este la ANGSD-wrapper/angsd-wrapper
Versiunea din acest depozit este depășită, vă rugăm să accesați versiunea legată mai sus.
ANGSD-wrapper este un utilitar dezvoltat pentru a ajuta la analiza datelor de secvențiere de generație următoare. Utilizatorii pot face următoarele cu această suită:
- Calculează un spectru de frecvențe de situs
- Calculează un spectru de frecvențe de situs 2D cu estimări FST corespunzătoare
- Realizează teste ABBA/BABA
- Extrage o secvență FASTA din fișiere BAM
- Calculează probabilitățile genotipurilor
- Estematizează Thetas și diverse statistici de neutralitate
- Calculează per-individual coeficientul de consangvinizare
- Găsește proporțiile de amestec
.
În ANGSD se utilizează abordări bazate pe probabilitate pentru a calcula statisticile sumare din datele de secvențiere de generație următoare. Scripturile de înfășurare și documentația sunt concepute pentru a face ANGSD ușor de utilizat.
Instalarea ANGSD-wrapper
Pentru a instala ANGSD-wrapper, descărcați de pe GitHub
git clone https://github.com/mojaveazure/angsd-wrapper.git
Intrați în ANGSD-wrapper
cd angsd-wrapper/
Executați comanda de instalare
./angsd-wrapper setup dependencies
Descărcați setul de date de exemplu (opțional)
./angsd-wrapper setup data
Finalizați instalarea
source ~/.bash_profile
O notă despre fișierele BAM
ANGSD necesită fișiere BAM ca intrare, iar ANGSD-wrapper transmite o listă de fișiere BAM către ANGSD. Aceste fișiere BAM au câteva cerințe:
- Filele BAM trebuie să aibă o linie de antet ‘@HD’
- Filele BAM trebuie să fie indexate (.bai)
Pentru a vedea dacă fișierele BAM au sau nu o linie de antet „@HD”, rulați următoarele pe lista dvs. de eșantioane:
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
Dacă vreun eșantion începe cu „@SQ” în loc de „@HD”, ANGSD și ANGSD-wrapper vor eșua. Acest Gist va adăuga un @HD
linii de antet @HD
la fișierele BAM.
Filierele de index trebuie să fie generate după fișierele BAM. Pentru a indexa fișierele BAM utilizând SAMTools, rulați următoarele pe lista dvs. de mostre:
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
Dacă aveți GNU Parallel instalat pe sistemul dvs., acest proces poate fi accelerat:
cat ~/path/to/sample_list.txt | parallel samtools index {}
Utilizare de bază
Pentru a rula ANGSD-wrapper, executați
angsd-wrapper <wrapper> <config>
Unde wrapper
este una dintre metodele pe care ANGSD-wrapper le poate executa și config
este calea relativă către fișierul de configurare corespunzător.
Pentru a vedea o listă a wrapperelor disponibile, rulați
angsd-wrapper
Fișiere de configurare
Există un fișier de configurare (config) pentru fiecare metodă disponibilă prin angsd-wrapper.
Fișierele de configurare conțin variabile utilizate de wrappere. Aici trebuie să modificați și să salvați variabilele (de exemplu, specificați căile de acces ale fișierelor BAM indexate/fișiere CRAM, fișiere FASTA, liste de eșantioane etc.) pentru a se potrivi cu eșantioanele dvs. înainte de a rula angsd-wrapper cu o metodă specificată.
Filele de configurare implicite se găsesc în directorul Configuration_Files
. Va trebui să le modificați pentru a se potrivi eșantioanelor dumneavoastră. Vă rugăm să consultați fișierele de configurare sau wiki pentru a vedea la ce este utilizată fiecare variabilă și cum trebuie să fie specificată. Dacă rulați angsd-wrapper
fără argumente, acesta va returna un mesaj de utilizare.
Filele de configurare de exemplu pot fi găsite în Example_Data/Configuration_Files
la rularea angsd-wrapper setup data
.
Informații suplimentare
Pentru mai multe informații despre ANGSD-wrapper, metodele disponibile prin ANGSD-wrapper și un tutorial cuprinzător, vă rugăm să consultați wiki.
Dependențe
Acest pachet necesită următoarele dependențe:
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
Acestea sunt descărcate și instalate automat atunci când este instalat angs-wrapper
Există alte câteva dependențe care nu sunt descărcate automat în timpul instalării:
- SAMTools
- GNU Scientific Library
- Git
- Wget
Metode acceptate
- Spectrul de frecvențe de la fața locului (SFS)
- Spectrul de frecvențe de la fața locului (SFS)
- Stimări Thetas
- 2D SFS și FST
- ABBA/BABA
- Extrageri de secvențe ancestrale
- Stimări de verosimilitate a genotipurilor
- Calcularea coeficienților de consangvinizare
- Analiză a componentelor principale
- Analiză de amestec
.
Citare ANGSD-wrapper
ANGSD-wrapper a fost publicat în Molecular Ecology Resources; dacă îl folosiți în lucrarea dvs. vă rugăm să citați articolul. Pentru utilizatorii BibTeX, citarea este după cum urmează:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}