mojaveazure / angsd-wrapper Archiviato

NOTA: L’ultima versione di ANGSD-wrapper è a ANGSD-wrapper/angsd-wrapper

La versione in questo repository non è aggiornata, si prega di andare alla versione collegata sopra.

ANGSD-wrapper è una utility sviluppata per aiutare l’analisi dei dati di sequenziamento di prossima generazione. Gli utenti possono fare quanto segue con questa suite:

  • Calcolare uno spettro di frequenza del sito
  • Calcolare uno spettro di frequenza del sito 2D con le corrispondenti stime FST
  • Eseguire test ABBA/BABA
  • .

  • Estrarre una sequenza FASTA da file BAM
  • Calcolare le probabilità dei genotipi
  • Stimare le Teta e varie statistiche di neutralità
  • Calcolare il coefficiente di inbreeding perindividuale
  • Trova le proporzioni di commistione

Approcci basati sulla probabilità sono usati in ANGSD per calcolare statistiche riassuntive dai dati di sequenziamento di prossima generazione. Gli script wrapper e la documentazione sono progettati per rendere ANGSD user-friendly.

Installazione di ANGSD-wrapper

Per installare ANGSD-wrapper, scarica da GitHub

git clone https://github.com/mojaveazure/angsd-wrapper.git

Entra nella directory ANGSD-wrapper

cd angsd-wrapper/

Esegui il comando setup

./angsd-wrapper setup dependencies

Scarica il dataset di esempio (opzionale)

./angsd-wrapper setup data

Finisci l’installazione

source ~/.bash_profile

Una nota sui file BAM

ANGSD richiede file BAM come input, e ANGSD-wrapper passa una lista di file BAM ad ANGSD. Questi file BAM hanno alcuni requisiti:

  • I file BAM devono avere una linea di intestazione ‘@HD’
  • I file BAM devono essere indicizzati (.bai)

Per vedere se i file BAM hanno o meno una riga di intestazione ‘@HD’, esegui il seguente comando sulla tua lista di campioni:

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

Se qualche campione inizia con ‘@SQ’ invece di ‘@HD’, ANGSD e ANGSD-wrapper falliranno. Questo Gist aggiungerà una @HDlinea di intestazione ai tuoi file BAM.

I file di indice devono essere generati dopo i file BAM. Per indicizzare i file BAM usando SAMTools, esegui quanto segue sulla tua lista di campioni:

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

Se hai GNU Parallel installato sul tuo sistema, questo processo può essere accelerato:

cat ~/path/to/sample_list.txt | parallel samtools index {}

Uso di base

Per eseguire ANGSD-wrapper, esegui

angsd-wrapper <wrapper> <config>

dove wrapper è uno dei metodi che ANGSD-wrapper può eseguire e config è il percorso relativo al file di configurazione corrispondente.

Per vedere un elenco di wrapper disponibili, esegui

angsd-wrapper

File di configurazione

C’è un file di configurazione (config) per ogni metodo disponibile attraverso angsd-wrapper.I file di configurazione contengono le variabili usate dai wrapper. Qui è dove è necessario modificare e salvare le variabili (cioè, specificare i percorsi dei file BAM indicizzati/file CRAM, file FASTA, elenchi di campioni, ecc.) per adattarsi ai propri campioni prima di eseguire angsd-wrapper con un metodo specificato.

I file di configurazione predefiniti si trovano nella directory Configuration_Files. Dovrai modificarli per adattarli ai tuoi campioni. Fai riferimento ai file di configurazione o al wiki per vedere per cosa viene usata ogni variabile e come dovrebbe essere specificata. Se esegui angsd-wrapper senza argomenti, restituirà un messaggio d’uso.

I file di configurazione di esempio possono essere trovati in Example_Data/Configuration_Files dopo aver eseguito angsd-wrapper setup data.

Altre informazioni

Per maggiori informazioni su ANGSD-wrapper, i metodi disponibili tramite ANGSD-wrapper e un tutorial completo, consulta il wiki.

Dipendenze

Questo pacchetto richiede le seguenti dipendenze:

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

Queste vengono scaricate e installate automaticamente quando viene installato angsd-wrapper

Ci sono alcune altre dipendenze che non vengono scaricate automaticamente durante l’installazione:

  • SAMTools
  • GNU Scientific Library
  • Git
  • Wget

Metodi supportati

  • Spettro di frequenza del sito (SFS)
  • Stime di tetas
  • SFS 2D e FST
  • ABBA/BABA
  • estrazioni di sequenze ancestrali
  • stime di verosimiglianza genotipica
  • calcolo dei coefficienti di consanguineità
  • analisi delle componenti principali
  • analisi di commistione

Citazione ANGSD-wrapper

ANGSD-wrapper è stato pubblicato su Molecular Ecology Resources; se lo usi nel tuo lavoro, per favore cita l’articolo. Per gli utenti BibTeX, la citazione è la seguente:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

Lascia un commento