NOTA: L’ultima versione di ANGSD-wrapper è a ANGSD-wrapper/angsd-wrapper
La versione in questo repository non è aggiornata, si prega di andare alla versione collegata sopra.
ANGSD-wrapper è una utility sviluppata per aiutare l’analisi dei dati di sequenziamento di prossima generazione. Gli utenti possono fare quanto segue con questa suite:
- Calcolare uno spettro di frequenza del sito
- Calcolare uno spettro di frequenza del sito 2D con le corrispondenti stime FST
- Eseguire test ABBA/BABA
- Estrarre una sequenza FASTA da file BAM
- Calcolare le probabilità dei genotipi
- Stimare le Teta e varie statistiche di neutralità
- Calcolare il coefficiente di inbreeding perindividuale
- Trova le proporzioni di commistione
.
Approcci basati sulla probabilità sono usati in ANGSD per calcolare statistiche riassuntive dai dati di sequenziamento di prossima generazione. Gli script wrapper e la documentazione sono progettati per rendere ANGSD user-friendly.
Installazione di ANGSD-wrapper
Per installare ANGSD-wrapper, scarica da GitHub
git clone https://github.com/mojaveazure/angsd-wrapper.git
Entra nella directory ANGSD-wrapper
cd angsd-wrapper/
Esegui il comando setup
./angsd-wrapper setup dependencies
Scarica il dataset di esempio (opzionale)
./angsd-wrapper setup data
Finisci l’installazione
source ~/.bash_profile
Una nota sui file BAM
ANGSD richiede file BAM come input, e ANGSD-wrapper passa una lista di file BAM ad ANGSD. Questi file BAM hanno alcuni requisiti:
- I file BAM devono avere una linea di intestazione ‘@HD’
- I file BAM devono essere indicizzati (.bai)
Per vedere se i file BAM hanno o meno una riga di intestazione ‘@HD’, esegui il seguente comando sulla tua lista di campioni:
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
Se qualche campione inizia con ‘@SQ’ invece di ‘@HD’, ANGSD e ANGSD-wrapper falliranno. Questo Gist aggiungerà una @HD
linea di intestazione ai tuoi file BAM.
I file di indice devono essere generati dopo i file BAM. Per indicizzare i file BAM usando SAMTools, esegui quanto segue sulla tua lista di campioni:
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
Se hai GNU Parallel installato sul tuo sistema, questo processo può essere accelerato:
cat ~/path/to/sample_list.txt | parallel samtools index {}
Uso di base
Per eseguire ANGSD-wrapper, esegui
angsd-wrapper <wrapper> <config>
dove wrapper
è uno dei metodi che ANGSD-wrapper può eseguire e config
è il percorso relativo al file di configurazione corrispondente.
Per vedere un elenco di wrapper disponibili, esegui
angsd-wrapper
File di configurazione
C’è un file di configurazione (config) per ogni metodo disponibile attraverso angsd-wrapper.
I file di configurazione contengono le variabili usate dai wrapper. Qui è dove è necessario modificare e salvare le variabili (cioè, specificare i percorsi dei file BAM indicizzati/file CRAM, file FASTA, elenchi di campioni, ecc.) per adattarsi ai propri campioni prima di eseguire angsd-wrapper con un metodo specificato.
I file di configurazione predefiniti si trovano nella directory Configuration_Files
. Dovrai modificarli per adattarli ai tuoi campioni. Fai riferimento ai file di configurazione o al wiki per vedere per cosa viene usata ogni variabile e come dovrebbe essere specificata. Se esegui angsd-wrapper
senza argomenti, restituirà un messaggio d’uso.
I file di configurazione di esempio possono essere trovati in Example_Data/Configuration_Files
dopo aver eseguito angsd-wrapper setup data
.
Altre informazioni
Per maggiori informazioni su ANGSD-wrapper, i metodi disponibili tramite ANGSD-wrapper e un tutorial completo, consulta il wiki.
Dipendenze
Questo pacchetto richiede le seguenti dipendenze:
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
Queste vengono scaricate e installate automaticamente quando viene installato angsd-wrapper
Ci sono alcune altre dipendenze che non vengono scaricate automaticamente durante l’installazione:
- SAMTools
- GNU Scientific Library
- Git
- Wget
Metodi supportati
- Spettro di frequenza del sito (SFS)
- Stime di tetas
- SFS 2D e FST
- ABBA/BABA
- estrazioni di sequenze ancestrali
- stime di verosimiglianza genotipica
- calcolo dei coefficienti di consanguineità
- analisi delle componenti principali
- analisi di commistione
Citazione ANGSD-wrapper
ANGSD-wrapper è stato pubblicato su Molecular Ecology Resources; se lo usi nel tuo lavoro, per favore cita l’articolo. Per gli utenti BibTeX, la citazione è la seguente:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}