molgenis / capice

CAPICE est une méthode computationnelle pour prédire la pathogénicité des SNV et des InDels.C’est un modèle d’arbre à boosting de gradient entraîné en utilisant une variété d’annotations génomiques utilisées par le scoreCADD et entraîné sur la signification clinique. Les performances de CAPICE sont constantes sur divers ensembles indépendants de données synthétiques et cliniques réelles. Il nosperform la meilleure méthode actuelle dans l’estimation de la pathogénicitépour les variantes de différentes conséquences moléculaires et la fréquence des allèles.

Le logiciel peut être utilisé comme un service web, comme des scores pré-calculés ou en installant le logiciel localement, tous décrits ci-dessous.

Utiliser le service web en ligne

CAPICE peut être utilisé comme service en ligne à http://molgenis.org/capice

Télécharger des fichiers de scores précalculés pour tous les SNV et InDels possibles (basés sur GrCh37)

Nous avons précalculé le score CAPICE pour tous les SNV et InDels possibles. Il peut être téléchargé via zenodo.

Le fichier contient les colonnes suivantes :#CHROM nom du chromosome, comme POS position génomique (assemblage du génome GrCh37)REF allèle de référenceALT allèles alternatifscore score CAPICE. Le score va de 0 à 1, plus il est élevé, plus le variant est susceptible d’être pathogène

Installer le logiciel CAPICE localement

Le logiciel CAPICE est également fourni dans ce dépôt pour exécuter CAPICE dans votre propre environnement.Les sections suivantes vous guideront à travers les étapes nécessaires pour l’annotation des variants et l’exécution de la réalisation de prédictions en utilisant le modèle CAPICE.

Conditions requises

Python 3.6 (ne fonctionne pas avec 3.7 ou 3.8)

Téléchargement, installation et traitement des fichiers d’entrée

  1. Logiciels et bibliothèquesLes scripts CAPICE peuvent être téléchargés à partir du dépôt github CAPICE. Le modèle CAPICE peut être téléchargé via #tbd
git clone https://github.com/molgenis/capice.gitcd capice
  1. Annotation des variables et format des fichiers d’entréeCAPICE utilise le même ensemble de fonctionnalités utilisées dans CADD. Dans ce dépôt, nous fournissons également un exemple de liste de variantes d’entrée dans CAPICE_example/test_input.vcf et le fichier d’entrée annoté dans CAPICE_example/test_caddAnnotated.tsv.gz

  2. PrédictionUne fois que le fichier annoté est prêt, alors la dernière étape serait d’utiliser le modèle pré-entraîné fourni dans le dépôt github.

bash predict.sh \/path/to/input \/path/to/CAPICE_model \/path/to/output \/path/to/log_file

.

Laisser un commentaire