mojaveazure / angsd-wrapper Arhivat

NOTĂ: Cea mai recentă versiune a ANGSD-wrapper este la ANGSD-wrapper/angsd-wrapper

Versiunea din acest depozit este depășită, vă rugăm să accesați versiunea legată mai sus.

ANGSD-wrapper este un utilitar dezvoltat pentru a ajuta la analiza datelor de secvențiere de generație următoare. Utilizatorii pot face următoarele cu această suită:

  • Calculează un spectru de frecvențe de situs
  • Calculează un spectru de frecvențe de situs 2D cu estimări FST corespunzătoare
  • Realizează teste ABBA/BABA
  • .

  • Extrage o secvență FASTA din fișiere BAM
  • Calculează probabilitățile genotipurilor
  • Estematizează Thetas și diverse statistici de neutralitate
  • Calculează per-individual coeficientul de consangvinizare
  • Găsește proporțiile de amestec

În ANGSD se utilizează abordări bazate pe probabilitate pentru a calcula statisticile sumare din datele de secvențiere de generație următoare. Scripturile de înfășurare și documentația sunt concepute pentru a face ANGSD ușor de utilizat.

Instalarea ANGSD-wrapper

Pentru a instala ANGSD-wrapper, descărcați de pe GitHub

git clone https://github.com/mojaveazure/angsd-wrapper.git

Intrați în ANGSD-wrapper

cd angsd-wrapper/

Executați comanda de instalare

./angsd-wrapper setup dependencies

Descărcați setul de date de exemplu (opțional)

./angsd-wrapper setup data

Finalizați instalarea

source ~/.bash_profile

O notă despre fișierele BAM

ANGSD necesită fișiere BAM ca intrare, iar ANGSD-wrapper transmite o listă de fișiere BAM către ANGSD. Aceste fișiere BAM au câteva cerințe:

  • Filele BAM trebuie să aibă o linie de antet ‘@HD’
  • Filele BAM trebuie să fie indexate (.bai)

Pentru a vedea dacă fișierele BAM au sau nu o linie de antet „@HD”, rulați următoarele pe lista dvs. de eșantioane:

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

Dacă vreun eșantion începe cu „@SQ” în loc de „@HD”, ANGSD și ANGSD-wrapper vor eșua. Acest Gist va adăuga un @HD linii de antet @HD la fișierele BAM.

Filierele de index trebuie să fie generate după fișierele BAM. Pentru a indexa fișierele BAM utilizând SAMTools, rulați următoarele pe lista dvs. de mostre:

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

Dacă aveți GNU Parallel instalat pe sistemul dvs., acest proces poate fi accelerat:

cat ~/path/to/sample_list.txt | parallel samtools index {}

Utilizare de bază

Pentru a rula ANGSD-wrapper, executați

angsd-wrapper <wrapper> <config>

Unde wrapper este una dintre metodele pe care ANGSD-wrapper le poate executa și config este calea relativă către fișierul de configurare corespunzător.

Pentru a vedea o listă a wrapperelor disponibile, rulați

angsd-wrapper

Fișiere de configurare

Există un fișier de configurare (config) pentru fiecare metodă disponibilă prin angsd-wrapper. Fișierele de configurare conțin variabile utilizate de wrappere. Aici trebuie să modificați și să salvați variabilele (de exemplu, specificați căile de acces ale fișierelor BAM indexate/fișiere CRAM, fișiere FASTA, liste de eșantioane etc.) pentru a se potrivi cu eșantioanele dvs. înainte de a rula angsd-wrapper cu o metodă specificată.

Filele de configurare implicite se găsesc în directorul Configuration_Files. Va trebui să le modificați pentru a se potrivi eșantioanelor dumneavoastră. Vă rugăm să consultați fișierele de configurare sau wiki pentru a vedea la ce este utilizată fiecare variabilă și cum trebuie să fie specificată. Dacă rulați angsd-wrapper fără argumente, acesta va returna un mesaj de utilizare.

Filele de configurare de exemplu pot fi găsite în Example_Data/Configuration_Files la rularea angsd-wrapper setup data.

Informații suplimentare

Pentru mai multe informații despre ANGSD-wrapper, metodele disponibile prin ANGSD-wrapper și un tutorial cuprinzător, vă rugăm să consultați wiki.

Dependențe

Acest pachet necesită următoarele dependențe:

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

Acestea sunt descărcate și instalate automat atunci când este instalat angs-wrapper

Există alte câteva dependențe care nu sunt descărcate automat în timpul instalării:

  • SAMTools
  • GNU Scientific Library
  • Git
  • Wget

Metode acceptate

  • Spectrul de frecvențe de la fața locului (SFS)
  • Spectrul de frecvențe de la fața locului (SFS)
  • Stimări Thetas
  • 2D SFS și FST
  • .

  • ABBA/BABA
  • Extrageri de secvențe ancestrale
  • Stimări de verosimilitate a genotipurilor
  • Calcularea coeficienților de consangvinizare
  • Analiză a componentelor principale
  • Analiză de amestec

Citare ANGSD-wrapper

ANGSD-wrapper a fost publicat în Molecular Ecology Resources; dacă îl folosiți în lucrarea dvs. vă rugăm să citați articolul. Pentru utilizatorii BibTeX, citarea este după cum urmează:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

Lasă un comentariu