OBS: Den senaste versionen av ANGSD-wrapper finns på ANGSD-wrapper/angsd-wrapper
Versionen i detta arkiv är föråldrad, gå till den version som är länkad ovan.
ANGSD-wrapper är ett verktyg utvecklat för att hjälpa till med analys av nästa generations sekvenseringsdata. Användare kan göra följande med denna svit:
- Beräkna ett spektrum av platsfrekvenser
- Beräkna ett 2D-spektrum av platsfrekvenser med motsvarande FST-skattningar
- Upprätta ABBA/BABA-tester
- Extrahera en FASTA-sekvens från BAM-filer
- Beräkna genotypsannolikheter
- Beräkna Thetas och olika neutralitetsstatistik
- Beräkna per-individens inavelskoefficient
- Hitta blandningsförhållanden
Sannolikhetsbaserade metoder används i ANGSD för att beräkna sammanfattande statistik från sekvenseringsdata från nästa generations sekvensering. Inkapslingsskripten och dokumentationen är utformade för att göra ANGSD användarvänligt.
Installation av ANGSD-wrapper
För att installera ANGSD-wrapper, ladda ner från GitHub
git clone https://github.com/mojaveazure/angsd-wrapper.git
Gå in i ANGSD-wrapper-katalogen
cd angsd-wrapper/
Kör installationskommandot
./angsd-wrapper setup dependencies
Ladda ner exempeldatasetetet (valfritt)
./angsd-wrapper setup data
Färdigställ installationen
source ~/.bash_profile
En anmärkning om BAM-filer
ANGSD kräver BAM-filer som indata, och ANGSD-wrapper skickar en lista med BAM-filer till ANGSD. Dessa BAM-filer har några krav:
- BAM-filerna måste ha en ”@HD”-huvudrad
- BAM-filerna måste vara indexerade (.bai)
För att se om BAM-filerna har en ”@HD”-huvudrad eller inte, kör följande på din lista med prover:
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
Om några prover börjar med ”@SQ” i stället för ”@HD” misslyckas ANGSD och ANGSD-wrapper. Denna Gist kommer att lägga till en @HD
rubrikrad till dina BAM-filer.
Indexfilerna måste genereras efter BAM-filerna. För att indexera BAM-filerna med SAMTools kör du följande på din provlista:
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
Om du har GNU Parallel installerat på ditt system kan denna process påskyndas:
cat ~/path/to/sample_list.txt | parallel samtools index {}
Grundläggande användning
För att köra ANGSD-wrapper, kör
angsd-wrapper <wrapper> <config>
Där wrapper
är en av metoderna som ANGSD-wrapper kan köra och config
är den relativa sökvägen till motsvarande konfigurationsfil.
För att se en lista över tillgängliga wrappers, kör
angsd-wrapper
Konfigurationsfiler
Det finns en konfigurationsfil (config) för varje metod som är tillgänglig via angsd-wrapper.
Konfigurationsfilerna innehåller variabler som används av wrappers. Det är här du måste ändra och spara variablerna (dvs. ange filvägar för indexerade BAM-filer/CRAM-filer, FASTA-filer, provlistor etc.) för att passa dina prov innan du kör angsd-wrapper med en angiven metod.
De förvalda konfigurationsfilerna finns i katalogen Configuration_Files
. Du måste ändra dem så att de passar dina prover. Se konfigurationsfilerna eller wikin för att se vad varje variabel används till och hur de ska anges. Om du kör angsd-wrapper
utan argument kommer den att returnera ett användningsmeddelande.
Exempelkonfigurationsfiler finns i Example_Data/Configuration_Files
när du kör angsd-wrapper setup data
.
Ytterligare information
För mer information om ANGSD-wrapper, metoderna som är tillgängliga genom ANGSD-wrapper och en omfattande handledning, vänligen se wikin.
Beroenden
Detta paket kräver följande beroenden:
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
Dessa hämtas och installeras automatiskt när angsd-wrapper installeras
Det finns några andra beroenden som inte hämtas automatiskt under installationen:
- SAMTools
- GNU Scientific Library
- Git
- Wget
Stödda metoder
- Site frequency spectrum (SFS)
- Thetas estimations
- 2D SFS och FST
- ABBA/BABA
- Extraktion av ursprunglig sekvens
- Skattningar av genotypens sannolikhet
- Beräkningar av inavelskoefficienter
- Som huvudkomponentanalys
- Analys av blandningar
Citerar ANGSD-wrapper
ANGSD-wrapper publicerades i Molecular Ecology Resources; Om du använder detta i ditt arbete bör du citera artikeln. För BibTeX-användare är citatet följande:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}