mojaveazure / angsd-wrapper Arkiverad

OBS: Den senaste versionen av ANGSD-wrapper finns på ANGSD-wrapper/angsd-wrapper

Versionen i detta arkiv är föråldrad, gå till den version som är länkad ovan.

ANGSD-wrapper är ett verktyg utvecklat för att hjälpa till med analys av nästa generations sekvenseringsdata. Användare kan göra följande med denna svit:

  • Beräkna ett spektrum av platsfrekvenser
  • Beräkna ett 2D-spektrum av platsfrekvenser med motsvarande FST-skattningar
  • Upprätta ABBA/BABA-tester
  • Extrahera en FASTA-sekvens från BAM-filer
  • Beräkna genotypsannolikheter
  • Beräkna Thetas och olika neutralitetsstatistik
  • Beräkna per-individens inavelskoefficient
  • Hitta blandningsförhållanden

Sannolikhetsbaserade metoder används i ANGSD för att beräkna sammanfattande statistik från sekvenseringsdata från nästa generations sekvensering. Inkapslingsskripten och dokumentationen är utformade för att göra ANGSD användarvänligt.

Installation av ANGSD-wrapper

För att installera ANGSD-wrapper, ladda ner från GitHub

git clone https://github.com/mojaveazure/angsd-wrapper.git

Gå in i ANGSD-wrapper-katalogen

cd angsd-wrapper/

Kör installationskommandot

./angsd-wrapper setup dependencies

Ladda ner exempeldatasetetet (valfritt)

./angsd-wrapper setup data

Färdigställ installationen

source ~/.bash_profile

En anmärkning om BAM-filer

ANGSD kräver BAM-filer som indata, och ANGSD-wrapper skickar en lista med BAM-filer till ANGSD. Dessa BAM-filer har några krav:

  • BAM-filerna måste ha en ”@HD”-huvudrad
  • BAM-filerna måste vara indexerade (.bai)

För att se om BAM-filerna har en ”@HD”-huvudrad eller inte, kör följande på din lista med prover:

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

Om några prover börjar med ”@SQ” i stället för ”@HD” misslyckas ANGSD och ANGSD-wrapper. Denna Gist kommer att lägga till en @HD rubrikrad till dina BAM-filer.

Indexfilerna måste genereras efter BAM-filerna. För att indexera BAM-filerna med SAMTools kör du följande på din provlista:

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

Om du har GNU Parallel installerat på ditt system kan denna process påskyndas:

cat ~/path/to/sample_list.txt | parallel samtools index {}

Grundläggande användning

För att köra ANGSD-wrapper, kör

angsd-wrapper <wrapper> <config>

Där wrapper är en av metoderna som ANGSD-wrapper kan köra och config är den relativa sökvägen till motsvarande konfigurationsfil.

För att se en lista över tillgängliga wrappers, kör

angsd-wrapper

Konfigurationsfiler

Det finns en konfigurationsfil (config) för varje metod som är tillgänglig via angsd-wrapper. Konfigurationsfilerna innehåller variabler som används av wrappers. Det är här du måste ändra och spara variablerna (dvs. ange filvägar för indexerade BAM-filer/CRAM-filer, FASTA-filer, provlistor etc.) för att passa dina prov innan du kör angsd-wrapper med en angiven metod.

De förvalda konfigurationsfilerna finns i katalogen Configuration_Files. Du måste ändra dem så att de passar dina prover. Se konfigurationsfilerna eller wikin för att se vad varje variabel används till och hur de ska anges. Om du kör angsd-wrapper utan argument kommer den att returnera ett användningsmeddelande.

Exempelkonfigurationsfiler finns i Example_Data/Configuration_Files när du kör angsd-wrapper setup data.

Ytterligare information

För mer information om ANGSD-wrapper, metoderna som är tillgängliga genom ANGSD-wrapper och en omfattande handledning, vänligen se wikin.

Beroenden

Detta paket kräver följande beroenden:

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

Dessa hämtas och installeras automatiskt när angsd-wrapper installeras

Det finns några andra beroenden som inte hämtas automatiskt under installationen:

  • SAMTools
  • GNU Scientific Library
  • Git
  • Wget

Stödda metoder

  • Site frequency spectrum (SFS)
  • Thetas estimations
  • 2D SFS och FST
  • ABBA/BABA
  • Extraktion av ursprunglig sekvens
  • Skattningar av genotypens sannolikhet
  • Beräkningar av inavelskoefficienter
  • Som huvudkomponentanalys
  • Analys av blandningar

Citerar ANGSD-wrapper

ANGSD-wrapper publicerades i Molecular Ecology Resources; Om du använder detta i ditt arbete bör du citera artikeln. För BibTeX-användare är citatet följande:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

Lämna en kommentar