OPMERKING: De laatste versie van ANGSD-wrapper is op ANGSD-wrapper/angsd-wrapper
De versie in deze repository is verouderd, ga naar de hierboven gelinkte versie.
ANGSD-wrapper is een hulpprogramma ontwikkeld om te helpen bij de analyse van next generation sequencing-gegevens. Gebruikers kunnen met deze suite het volgende doen:
- Bereken een site-frequentiespectrum
- Bereken een 2D site-frequentiespectrum met bijbehorende FST-schattingen
- Voer ABBA/BABA-tests uit
- Extraheer een FASTA-sequentie uit BAM-bestanden
- Bereken genotype waarschijnlijkheden
- Bereken Thetas en diverse neutraliteitsstatistieken
- Bereken per-individuele inteeltcoëfficiënt
- Vind vermengingsverhoudingen
In ANGSD worden benaderingen op basis van waarschijnlijkheid gebruikt om samenvattende statistieken te berekenen uit next generation sequencing data. De wrapper scripts en documentatie zijn ontworpen om ANGSD gebruikersvriendelijk te maken.
ANGSD-wrapper installeren
Om ANGSD-wrapper te installeren, te downloaden van GitHub
git clone https://github.com/mojaveazure/angsd-wrapper.git
Ga naar de ANGSD-wrapper
cd angsd-wrapper/
Run het setup commando
./angsd-wrapper setup dependencies
Download de voorbeeld dataset (optioneel)
./angsd-wrapper setup data
Voltooi de installatie
source ~/.bash_profile
Een opmerking over BAM bestanden
ANGSD vereist BAM bestanden als invoer, en ANGSD-wrapper geeft een lijst met BAM-bestanden door aan ANGSD. Deze BAM bestanden hebben een paar vereisten:
- De BAM bestanden moeten een ‘@HD’ header regel hebben
- De BAM bestanden moeten geïndexeerd zijn (.bai)
Om te zien of de BAM-bestanden al dan niet een ‘@HD’-headerregel hebben, voert u het volgende uit op uw lijst met monsters:
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
Als er monsters zijn die beginnen met ‘@SQ’ in plaats van ‘@HD’, zullen ANGSD en ANGSD-wrapper falen. Deze Gist voegt een @HD
-headerregel toe aan uw BAM-bestanden.
De indexbestanden moeten na de BAM-bestanden worden gegenereerd. Om de BAM-bestanden met SAMTools te indexeren, voert u het volgende uit op uw monsterlijst:
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
Als u GNU Parallel op uw systeem hebt geïnstalleerd, kan dit proces worden versneld:
cat ~/path/to/sample_list.txt | parallel samtools index {}
Basisgebruik
Om ANGSD-wrapper uit te voeren, voert u
angsd-wrapper <wrapper> <config>
uit, waarbij wrapper
een van de methoden is die ANGSD-wrapper kan uitvoeren en config
het relatieve pad is naar het bijbehorende configuratiebestand.
Om een lijst met beschikbare wrappers te zien, voert u
angsd-wrapper
Configuratiebestanden
Er is een configuratiebestand (config) voor elke methode die beschikbaar is via angsd-wrapper.
De configuratiebestanden bevatten variabelen die door de wrappers worden gebruikt. Hier moet u de variabelen wijzigen en opslaan (d.w.z. bestandspaden opgeven van geïndexeerde BAM-bestanden/CRAM-bestanden, FASTA-bestanden, monsterlijsten, enz.) om ze aan te passen aan uw monsters voordat u angsd-wrapper uitvoert met een gespecificeerde methode.
De standaard configuratiebestanden kunnen worden gevonden in de Configuration_Files
directory. U zult ze moeten wijzigen om ze aan uw voorbeelden aan te passen. Raadpleeg de configuratiebestanden of de wiki om te zien waar elke variabele voor wordt gebruikt en hoe ze moeten worden gespecificeerd. Als u angsd-wrapper
uitvoert zonder argumenten, zal het een gebruiksmelding teruggeven.
Voorbeeld config bestanden kunnen worden gevonden in Example_Data/Configuration_Files
na het uitvoeren van angsd-wrapper setup data
.
Volgende informatie
Voor meer informatie over ANGSD-wrapper, de methoden die beschikbaar zijn via ANGSD-wrapper, en een uitgebreide tutorial, zie de wiki.
Afhankelijkheden
Dit pakket vereist de volgende afhankelijkheden:
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
Deze worden automatisch gedownload en geïnstalleerd wanneer angsd-wrapper wordt geïnstalleerd
Er zijn een paar andere afhankelijkheden die niet automatisch worden gedownload tijdens de installatie:
- SAMTools
- GNU Scientific Library
- Git
- Wget
Ondersteunde methoden
- Site frequency spectrum (SFS)
- Thetas-schattingen
- 2D SFS en FST
- ABBA/BABA
- Extracties van voorouderlijke sequenties
- Genotype likelihood estimations
- Berekeningen van inteeltcoëfficiënten
- Principal component analysis
- Admixture analysis
Citing ANGSD-wrapper
ANGSD-wrapper werd gepubliceerd in Molecular Ecology Resources; als u dit in uw werk gebruikt, citeer dan alstublieft het artikel. Voor BibTeX gebruikers, de aanhaling is als volgt:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}