BEMÆRK: Den seneste version af ANGSD-wrapper findes på ANGSD-wrapper/angsd-wrapper
Versionen i dette arkiv er forældet, gå venligst til den version, der er linket til ovenfor.
ANGSD-wrapper er et værktøj, der er udviklet til at hjælpe med at analysere næste generations sekventeringsdata. Brugere kan gøre følgende med denne suite:
- Beregne et stedfrekvensspektrum
- Beregne et 2D-stedfrekvensspektrum med tilsvarende FST-estimater
- Udføre ABBA/BABA-tests
- Udtræk en FASTA-sekvens fra BAM-filer
- Beregn genotype-sandsynligheder
- Skøn over Thetas og forskellige neutralitetsstatistikker
- Beregn per-individuel indavlskoefficient
- Find blandingsforhold
Likelihood-baserede metoder anvendes i ANGSD til at beregne sammenfattende statistikker fra næste generations sekventeringsdata. Wrapperscripts og dokumentation er designet til at gøre ANGSD brugervenligt.
Installation af ANGSD-wrapper
For at installere ANGSD-wrapper, downloades fra GitHub
git clone https://github.com/mojaveazure/angsd-wrapper.git
Gå ind i ANGSD-wrapper-mappen
cd angsd-wrapper/
Kør setup-kommandoen
./angsd-wrapper setup dependencies
Download eksempeldatasættet (valgfrit)
./angsd-wrapper setup data
Færdiggør installationen
source ~/.bash_profile
En note om BAM-filer
ANGSD kræver BAM-filer som input, og ANGSD-wrapper videregiver en liste over BAM-filer til ANGSD. Disse BAM-filer har et par krav:
- BAM-filerne skal have en “@HD”-hovedlinje
- BAM-filerne skal være indekseret (.bai)
For at se, om BAM-filerne har en ‘@HD’-hovedlinje, skal du køre følgende på din liste over prøver:
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
Hvis nogen prøver begynder med ‘@SQ’ i stedet for ‘@HD’, vil ANGSD og ANGSD-wrapper fejle. Denne Gist vil tilføje en @HD
headerlinjer til dine BAM-filer.
Indeksfilerne skal genereres efter BAM-filerne. For at indeksere BAM-filerne ved hjælp af SAMTools skal du køre følgende på din eksempelliste:
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
Hvis du har GNU Parallel installeret på dit system, kan denne proces blive fremskyndet:
cat ~/path/to/sample_list.txt | parallel samtools index {}
Grundlæggende brug
For at køre ANGSD-wrapper skal du køre
angsd-wrapper <wrapper> <config>
Hvor wrapper
er en af de metoder, som ANGSD-wrapper kan køre, og config
er den relative sti til den tilsvarende konfigurationsfil.
For at se en liste over tilgængelige wrappere skal du køre
angsd-wrapper
Konfigurationsfiler
Der er en konfigurationsfil (config) for hver metode, der er tilgængelig via angsd-wrapper.
Konfigurationsfilerne indeholder variabler, der bruges af wrapperne. Det er her, du skal ændre og gemme variablerne (dvs. angive filstier for indekserede BAM-filer/CRAM-filer, FASTA-filer, prøvelister osv.), så de passer til dine prøver, før du kører angsd-wrapper med en bestemt metode.
De standardkonfigurationsfiler kan findes i mappen Configuration_Files
. Du skal ændre dem, så de passer til dine prøver. Se venligst konfigurationsfilerne eller wikien for at se, hvad hver enkelt variabel bruges til, og hvordan de skal angives. Hvis du kører angsd-wrapper
uden argumenter, returnerer den en brugsbesked.
Eksempelkonfigurationsfiler kan findes i Example_Data/Configuration_Files
ved kørsel af angsd-wrapper setup data
.
Yderligere oplysninger
For yderligere oplysninger om ANGSD-wrapper, de metoder, der er tilgængelige gennem ANGSD-wrapper, og en omfattende vejledning, se venligst wikien.
Afhængigheder
Denne pakke kræver følgende afhængigheder:
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
Disse hentes og installeres automatisk, når angsd-wrapper installeres
Der er et par andre afhængigheder, som ikke automatisk hentes under installationen:
- SAMTools
- GNU Scientific Library
- Git
- Wget
Understøttede metoder
- Site frequency spectrum (SFS)
- Thetas estimationer
- 2D SFS og FST
- ABBA/BABA
- Afgangssekvensudtrækninger
- Genotype likelihood-estimater
- Beregninger af indavlskoefficienter
- Principal component analysis
- Admixture analysis
Citing ANGSD-wrapper
ANGSD-wrapper blev offentliggjort i Molecular Ecology Resources; hvis du bruger dette i dit arbejde, bedes du citere artiklen. For BibTeX-brugere er citatet som følger:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}