NOTE : La dernière version d’ANGSD-wrapper se trouve à ANGSD-wrapper/angsd-wrapper
La version dans ce dépôt est périmée, veuillez aller à la version liée ci-dessus.
ANGSD-wrapper est un utilitaire développé pour aider à l’analyse des données de séquençage de prochaine génération. Les utilisateurs peuvent faire ce qui suit avec cette suite :
- Calculer un spectre de fréquence de site
- Calculer un spectre de fréquence de site 2D avec les estimations FST correspondantes
- Préparer les tests ABBA/BABA
- Extraire une séquence FASTA à partir de fichiers BAM
- Calculer des vraisemblances de génotype
- Estimer des Thétas et diverses statistiques de neutralité
- Calculer un coefficient de consanguinité per-.individu
- Trouver les proportions d’admixture
.
Des approches basées sur la vraisemblance sont utilisées dans ANGSD pour calculer des statistiques sommaires à partir de données de séquençage de nouvelle génération. Les scripts wrappers et la documentation sont conçus pour rendre ANGSD convivial.
Installation d’ANGSD-wrapper
Pour installer ANGSD-wrapper, téléchargez depuis GitHub
git clone https://github.com/mojaveazure/angsd-wrapper.git
Allez dans le répertoire ANGSD-wrapper
cd angsd-wrapper/
Exécuter la commande setup
./angsd-wrapper setup dependencies
Télécharger le jeu de données d’exemple (facultatif)
./angsd-wrapper setup data
Finir l’installation
source ~/.bash_profile
Une note sur les fichiers BAM
ANGSD nécessite des fichiers BAM en entrée, et ANGSD-wrapper passe une liste de fichiers BAM à ANGSD. Ces fichiers BAM ont quelques exigences:
- Les fichiers BAM doivent avoir une ligne d’en-tête ‘@HD’
- Les fichiers BAM doivent être indexés (.bai)
Pour voir si les fichiers BAM ont ou non une ligne d’en-tête ‘@HD’, exécutez ce qui suit sur votre liste d’échantillons :
for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done
Si des échantillons commencent par ‘@SQ’ au lieu de ‘@HD’, ANGSD et ANGSD-wrapper échoueront. Ce Gist ajoutera une @HD
ligne d’en-tête à vos fichiers BAM.
Les fichiers d’index doivent être générés après les fichiers BAM. Pour indexer les fichiers BAM en utilisant SAMTools, exécutez ce qui suit sur votre liste d’échantillons :
for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone
Si GNU Parallel est installé sur votre système, ce processus peut être accéléré :
cat ~/path/to/sample_list.txt | parallel samtools index {}
Utilisation de base
Pour exécuter ANGSD-wrapper, exécutez
angsd-wrapper <wrapper> <config>
où wrapper
est l’une des méthodes qu’ANGSD-wrapper peut exécuter et config
est le chemin relatif vers le fichier de configuration correspondant.
Pour voir une liste des wrappers disponibles, exécutez
angsd-wrapper
Fichiers de configuration
Il y a un fichier de configuration (config) pour chaque méthode disponible par angsd-wrapper.
Les fichiers de configuration contiennent des variables utilisées par les wrappers. C’est ici que vous devez modifier et enregistrer les variables (c’est-à-dire spécifier les chemins de fichiers des fichiers BAM/CRAM indexés, les fichiers FASTA, les listes d’échantillons, etc.) pour convenir à vos échantillons avant d’exécuter angsd-wrapper avec une méthode spécifiée.
Les fichiers de configuration par défaut se trouvent dans le répertoire Configuration_Files
. Vous devrez les modifier pour les adapter à vos échantillons. Veuillez vous référer aux fichiers de configuration ou au wiki pour voir à quoi sert chaque variable et comment elles doivent être spécifiées. Si vous exécutez angsd-wrapper
sans aucun argument, il retournera un message d’utilisation.
Des exemples de fichiers de configuration peuvent être trouvés dans Example_Data/Configuration_Files
lors de l’exécution de angsd-wrapper setup data
.
Informations supplémentaires
Pour plus d’informations sur ANGSD-wrapper, les méthodes disponibles à travers ANGSD-wrapper, et un tutoriel complet, veuillez consulter le wiki.
Dépendances
Ce paquet nécessite les dépendances suivantes :
- ANGSD
- ngsPopGen
- ngsF
- ngsAdmix
Elles sont téléchargées et installées automatiquement lorsque angsd-wrapper est installé
Il y a quelques autres dépendances qui ne sont pas automatiquement téléchargées lors de l’installation :
- SAMTools
- Bibliothèque scientifique du GNU
- Git
- Wget
Méthodes prises en charge
- Spectre de fréquence du site (SFS)
- Estimations dehetas
- SFS et FST 2D
- ABBA/BABA
- Extractions de séquences ancestrales
- Estimations de la vraisemblance génotypique
- Calculs des coefficients de consanguinité
- Analyse en composantes principales
- Analyse de mélange
.
Citation de l’ANGSD-.wrapper
ANGSD-wrapper a été publié dans Molecular Ecology Resources ; si vous l’utilisez dans votre travail, veuillez citer l’article. Pour les utilisateurs de BibTeX, la citation est la suivante:
@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}
.