mojaveazure / angsd-wrapper Archivé

NOTE : La dernière version d’ANGSD-wrapper se trouve à ANGSD-wrapper/angsd-wrapper

La version dans ce dépôt est périmée, veuillez aller à la version liée ci-dessus.

ANGSD-wrapper est un utilitaire développé pour aider à l’analyse des données de séquençage de prochaine génération. Les utilisateurs peuvent faire ce qui suit avec cette suite :

  • Calculer un spectre de fréquence de site
  • Calculer un spectre de fréquence de site 2D avec les estimations FST correspondantes
  • Préparer les tests ABBA/BABA
  • .

  • Extraire une séquence FASTA à partir de fichiers BAM
  • Calculer des vraisemblances de génotype
  • Estimer des Thétas et diverses statistiques de neutralité
  • Calculer un coefficient de consanguinité per-.individu
  • Trouver les proportions d’admixture

Des approches basées sur la vraisemblance sont utilisées dans ANGSD pour calculer des statistiques sommaires à partir de données de séquençage de nouvelle génération. Les scripts wrappers et la documentation sont conçus pour rendre ANGSD convivial.

Installation d’ANGSD-wrapper

Pour installer ANGSD-wrapper, téléchargez depuis GitHub

git clone https://github.com/mojaveazure/angsd-wrapper.git

Allez dans le répertoire ANGSD-wrapper

cd angsd-wrapper/

Exécuter la commande setup

./angsd-wrapper setup dependencies

Télécharger le jeu de données d’exemple (facultatif)

./angsd-wrapper setup data

Finir l’installation

source ~/.bash_profile

Une note sur les fichiers BAM

ANGSD nécessite des fichiers BAM en entrée, et ANGSD-wrapper passe une liste de fichiers BAM à ANGSD. Ces fichiers BAM ont quelques exigences:

  • Les fichiers BAM doivent avoir une ligne d’en-tête ‘@HD’
  • Les fichiers BAM doivent être indexés (.bai)

Pour voir si les fichiers BAM ont ou non une ligne d’en-tête ‘@HD’, exécutez ce qui suit sur votre liste d’échantillons :

for sample in `cat ~/path/to/sample_list.txt`do echo $sample samtools view -H $sample | head -1done

Si des échantillons commencent par ‘@SQ’ au lieu de ‘@HD’, ANGSD et ANGSD-wrapper échoueront. Ce Gist ajoutera une @HDligne d’en-tête à vos fichiers BAM.

Les fichiers d’index doivent être générés après les fichiers BAM. Pour indexer les fichiers BAM en utilisant SAMTools, exécutez ce qui suit sur votre liste d’échantillons :

for sample in `cat ~/path/to/sample_list.txt`do samtools index $sampledone

Si GNU Parallel est installé sur votre système, ce processus peut être accéléré :

cat ~/path/to/sample_list.txt | parallel samtools index {}

Utilisation de base

Pour exécuter ANGSD-wrapper, exécutez

angsd-wrapper <wrapper> <config>

wrapper est l’une des méthodes qu’ANGSD-wrapper peut exécuter et config est le chemin relatif vers le fichier de configuration correspondant.

Pour voir une liste des wrappers disponibles, exécutez

angsd-wrapper

Fichiers de configuration

Il y a un fichier de configuration (config) pour chaque méthode disponible par angsd-wrapper.Les fichiers de configuration contiennent des variables utilisées par les wrappers. C’est ici que vous devez modifier et enregistrer les variables (c’est-à-dire spécifier les chemins de fichiers des fichiers BAM/CRAM indexés, les fichiers FASTA, les listes d’échantillons, etc.) pour convenir à vos échantillons avant d’exécuter angsd-wrapper avec une méthode spécifiée.

Les fichiers de configuration par défaut se trouvent dans le répertoire Configuration_Files. Vous devrez les modifier pour les adapter à vos échantillons. Veuillez vous référer aux fichiers de configuration ou au wiki pour voir à quoi sert chaque variable et comment elles doivent être spécifiées. Si vous exécutez angsd-wrapper sans aucun argument, il retournera un message d’utilisation.

Des exemples de fichiers de configuration peuvent être trouvés dans Example_Data/Configuration_Files lors de l’exécution de angsd-wrapper setup data.

Informations supplémentaires

Pour plus d’informations sur ANGSD-wrapper, les méthodes disponibles à travers ANGSD-wrapper, et un tutoriel complet, veuillez consulter le wiki.

Dépendances

Ce paquet nécessite les dépendances suivantes :

  • ANGSD
  • ngsPopGen
  • ngsF
  • ngsAdmix

Elles sont téléchargées et installées automatiquement lorsque angsd-wrapper est installé

Il y a quelques autres dépendances qui ne sont pas automatiquement téléchargées lors de l’installation :

  • SAMTools
  • Bibliothèque scientifique du GNU
  • Git
  • Wget

Méthodes prises en charge

  • Spectre de fréquence du site (SFS)
  • Estimations dehetas
  • SFS et FST 2D
  • .

  • ABBA/BABA
  • Extractions de séquences ancestrales
  • Estimations de la vraisemblance génotypique
  • Calculs des coefficients de consanguinité
  • Analyse en composantes principales
  • Analyse de mélange

Citation de l’ANGSD-.wrapper

ANGSD-wrapper a été publié dans Molecular Ecology Resources ; si vous l’utilisez dans votre travail, veuillez citer l’article. Pour les utilisateurs de BibTeX, la citation est la suivante:

@article {MEN:MEN12578,author = {Durvasula, Arun and Hoffman, Paul J. and Kent, Tyler V. and Liu, Chaochih and Kono, Thomas J. Y. and Morrell, Peter L. and Ross-Ibarra, Jeffrey},title = {angsd-wrapper: utilities for analysing next-generation sequencing data},journal = {Molecular Ecology Resources},issn = {1755-0998},url = {http://dx.doi.org/10.1111/1755-0998.12578},doi = {10.1111/1755-0998.12578},pages = {n/a--n/a},keywords = {domestication, population genetics, software, visualization, Zea},year = {2016},}

.

Laisser un commentaire