mojaveazure / angsd-wrapper Arkiveret

BEMÆRK: Den seneste version af ANGSD-wrapper findes på ANGSD-wrapper/angsd-wrapper

Versionen i dette arkiv er forældet, gå venligst til den version, der er linket til ovenfor.

ANGSD-wrapper er et værktøj, der er udviklet til at hjælpe med at analysere næste generations sekventeringsdata. Brugere kan gøre følgende med denne suite:

  • Beregne et stedfrekvensspektrum
  • Beregne et 2D-stedfrekvensspektrum med tilsvarende FST-estimater
  • Udføre ABBA/BABA-tests
  • Udtræk en FASTA-sekvens fra BAM-filer
  • Beregn genotype-sandsynligheder
  • Skøn over Thetas og forskellige neutralitetsstatistikker
  • Beregn per-individuel indavlskoefficient
  • Find blandingsforhold

Likelihood-baserede metoder anvendes i ANGSD til at beregne sammenfattende statistikker fra næste generations sekventeringsdata. Wrapperscripts og dokumentation er designet til at gøre ANGSD brugervenligt.

Installation af ANGSD-wrapper

For at installere ANGSD-wrapper, downloades fra GitHub

git clone https://github.com/mojaveazure/angsd-wrapper.git

Gå ind i ANGSD-wrapper-mappen

cd angsd-wrapper/

Kør setup-kommandoen

./angsd-wrapper setup dependencies

Download eksempeldatasættet (valgfrit)

./angsd-wrapper setup data

Færdiggør installationen

source ~/.bash_profile

En note om BAM-filer

ANGSD kræver BAM-filer som input, og ANGSD-wrapper videregiver en liste over BAM-filer til ANGSD. Disse BAM-filer har et par krav:

  • BAM-filerne skal have en “@HD”-hovedlinje
  • BAM-filerne skal være indekseret (.bai)

For at se, om BAM-filerne har en ‘@HD’-hovedlinje, skal du køre følgende på din liste over prøver:

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

Hvis nogen prøver begynder med ‘@SQ’ i stedet for ‘@HD’, vil ANGSD og ANGSD-wrapper fejle. Denne Gist vil tilføje en @HD headerlinjer til dine BAM-filer.

Indeksfilerne skal genereres efter BAM-filerne. For at indeksere BAM-filerne ved hjælp af SAMTools skal du køre følgende på din eksempelliste:

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

Hvis du har GNU Parallel installeret på dit system, kan denne proces blive fremskyndet:

cat ~/path/to/sample_list.txt | parallel samtools index {}

Grundlæggende brug

For at køre ANGSD-wrapper skal du køre

angsd-wrapper <wrapper> <config>

Hvor wrapper er en af de metoder, som ANGSD-wrapper kan køre, og config er den relative sti til den tilsvarende konfigurationsfil.

For at se en liste over tilgængelige wrappere skal du køre

angsd-wrapper

Konfigurationsfiler

Der er en konfigurationsfil (config) for hver metode, der er tilgængelig via angsd-wrapper. Konfigurationsfilerne indeholder variabler, der bruges af wrapperne. Det er her, du skal ændre og gemme variablerne (dvs. angive filstier for indekserede BAM-filer/CRAM-filer, FASTA-filer, prøvelister osv.), så de passer til dine prøver, før du kører angsd-wrapper med en bestemt metode.

De standardkonfigurationsfiler kan findes i mappen Configuration_Files. Du skal ændre dem, så de passer til dine prøver. Se venligst konfigurationsfilerne eller wikien for at se, hvad hver enkelt variabel bruges til, og hvordan de skal angives. Hvis du kører angsd-wrapper uden argumenter, returnerer den en brugsbesked.

Eksempelkonfigurationsfiler kan findes i Example_Data/Configuration_Files ved kørsel af angsd-wrapper setup data.

Yderligere oplysninger

For yderligere oplysninger om ANGSD-wrapper, de metoder, der er tilgængelige gennem ANGSD-wrapper, og en omfattende vejledning, se venligst wikien.

Afhængigheder

Denne pakke kræver følgende afhængigheder:

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

Disse hentes og installeres automatisk, når angsd-wrapper installeres

Der er et par andre afhængigheder, som ikke automatisk hentes under installationen:

  • SAMTools
  • GNU Scientific Library
  • Git
  • Wget

Understøttede metoder

  • Site frequency spectrum (SFS)
  • Thetas estimationer
  • 2D SFS og FST
  • ABBA/BABA
  • Afgangssekvensudtrækninger
  • Genotype likelihood-estimater
  • Beregninger af indavlskoefficienter
  • Principal component analysis
  • Admixture analysis

Citing ANGSD-wrapper

ANGSD-wrapper blev offentliggjort i Molecular Ecology Resources; hvis du bruger dette i dit arbejde, bedes du citere artiklen. For BibTeX-brugere er citatet som følger:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

Skriv en kommentar