mojaveazure / angsd-wrapper Archived

OPMERKING: De laatste versie van ANGSD-wrapper is op ANGSD-wrapper/angsd-wrapper

De versie in deze repository is verouderd, ga naar de hierboven gelinkte versie.

ANGSD-wrapper is een hulpprogramma ontwikkeld om te helpen bij de analyse van next generation sequencing-gegevens. Gebruikers kunnen met deze suite het volgende doen:

  • Bereken een site-frequentiespectrum
  • Bereken een 2D site-frequentiespectrum met bijbehorende FST-schattingen
  • Voer ABBA/BABA-tests uit
  • Extraheer een FASTA-sequentie uit BAM-bestanden
  • Bereken genotype waarschijnlijkheden
  • Bereken Thetas en diverse neutraliteitsstatistieken
  • Bereken per-individuele inteeltcoëfficiënt
  • Vind vermengingsverhoudingen

In ANGSD worden benaderingen op basis van waarschijnlijkheid gebruikt om samenvattende statistieken te berekenen uit next generation sequencing data. De wrapper scripts en documentatie zijn ontworpen om ANGSD gebruikersvriendelijk te maken.

ANGSD-wrapper installeren

Om ANGSD-wrapper te installeren, te downloaden van GitHub

git clone https://github.com/mojaveazure/angsd-wrapper.git

Ga naar de ANGSD-wrapper

cd angsd-wrapper/

Run het setup commando

./angsd-wrapper setup dependencies

Download de voorbeeld dataset (optioneel)

./angsd-wrapper setup data

Voltooi de installatie

source ~/.bash_profile

Een opmerking over BAM bestanden

ANGSD vereist BAM bestanden als invoer, en ANGSD-wrapper geeft een lijst met BAM-bestanden door aan ANGSD. Deze BAM bestanden hebben een paar vereisten:

  • De BAM bestanden moeten een ‘@HD’ header regel hebben
  • De BAM bestanden moeten geïndexeerd zijn (.bai)

Om te zien of de BAM-bestanden al dan niet een ‘@HD’-headerregel hebben, voert u het volgende uit op uw lijst met monsters:

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

Als er monsters zijn die beginnen met ‘@SQ’ in plaats van ‘@HD’, zullen ANGSD en ANGSD-wrapper falen. Deze Gist voegt een @HD-headerregel toe aan uw BAM-bestanden.

De indexbestanden moeten na de BAM-bestanden worden gegenereerd. Om de BAM-bestanden met SAMTools te indexeren, voert u het volgende uit op uw monsterlijst:

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

Als u GNU Parallel op uw systeem hebt geïnstalleerd, kan dit proces worden versneld:

cat ~/path/to/sample_list.txt | parallel samtools index {}

Basisgebruik

Om ANGSD-wrapper uit te voeren, voert u

angsd-wrapper <wrapper> <config>

uit, waarbij wrapper een van de methoden is die ANGSD-wrapper kan uitvoeren en config het relatieve pad is naar het bijbehorende configuratiebestand.

Om een lijst met beschikbare wrappers te zien, voert u

angsd-wrapper

Configuratiebestanden

Er is een configuratiebestand (config) voor elke methode die beschikbaar is via angsd-wrapper. De configuratiebestanden bevatten variabelen die door de wrappers worden gebruikt. Hier moet u de variabelen wijzigen en opslaan (d.w.z. bestandspaden opgeven van geïndexeerde BAM-bestanden/CRAM-bestanden, FASTA-bestanden, monsterlijsten, enz.) om ze aan te passen aan uw monsters voordat u angsd-wrapper uitvoert met een gespecificeerde methode.

De standaard configuratiebestanden kunnen worden gevonden in de Configuration_Files directory. U zult ze moeten wijzigen om ze aan uw voorbeelden aan te passen. Raadpleeg de configuratiebestanden of de wiki om te zien waar elke variabele voor wordt gebruikt en hoe ze moeten worden gespecificeerd. Als u angsd-wrapper uitvoert zonder argumenten, zal het een gebruiksmelding teruggeven.

Voorbeeld config bestanden kunnen worden gevonden in Example_Data/Configuration_Files na het uitvoeren van angsd-wrapper setup data.

Volgende informatie

Voor meer informatie over ANGSD-wrapper, de methoden die beschikbaar zijn via ANGSD-wrapper, en een uitgebreide tutorial, zie de wiki.

Afhankelijkheden

Dit pakket vereist de volgende afhankelijkheden:

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

Deze worden automatisch gedownload en geïnstalleerd wanneer angsd-wrapper wordt geïnstalleerd

Er zijn een paar andere afhankelijkheden die niet automatisch worden gedownload tijdens de installatie:

  • SAMTools
  • GNU Scientific Library
  • Git
  • Wget

Ondersteunde methoden

  • Site frequency spectrum (SFS)
  • Thetas-schattingen
  • 2D SFS en FST
  • ABBA/BABA
  • Extracties van voorouderlijke sequenties
  • Genotype likelihood estimations
  • Berekeningen van inteeltcoëfficiënten
  • Principal component analysis
  • Admixture analysis

Citing ANGSD-wrapper

ANGSD-wrapper werd gepubliceerd in Molecular Ecology Resources; als u dit in uw werk gebruikt, citeer dan alstublieft het artikel. Voor BibTeX gebruikers, de aanhaling is als volgt:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

Plaats een reactie