molgenis / capice

CAPICE ist eine computergestützte Methode zur Vorhersage der Pathogenität von SNVs und InDels. Es handelt sich um ein Gradient-Boosting-Baummodell, das anhand einer Vielzahl von genomischen Annotationen trainiert wurde, die vomCADD-Score verwendet werden, und das auf die klinische Bedeutung trainiert wurde. CAPICE erbringt konsistente Leistungen in verschiedenen unabhängigen synthetischen und realen klinischen Datensätzen. Es ist die derzeit beste Methode zur Abschätzung der Pathogenität von Varianten mit unterschiedlichen molekularen Konsequenzen und Allelhäufigkeiten.

Die Software kann als Webservice, als vorberechnete Scores oder durch lokale Installation der Software genutzt werden, die alle unten beschrieben werden.

Online-Webdienst nutzen

CAPICE kann als Online-Dienst genutzt werden unter http://molgenis.org/capice

Download von Dateien mit vorberechneten Scores für alle möglichen SNVs und InDels (basierend auf GrCh37)

Wir haben den CAPICE-Score für alle möglichen SNVs und InDels vorberechnet. Sie kann über zenodo heruntergeladen werden.

Die Datei enthält die folgenden Spalten:#CHROM Chromosomenname, als POS genomische Position (GrCh37 Genom-Assembly)REF ReferenzallelALT alternative Allelecore CAPICE-Score. Der Score reicht von 0 bis 1, je höher, desto wahrscheinlicher ist es, dass die Variante pathogen ist

Installieren Sie die CAPICE-Software lokal

Die CAPICE-Software wird ebenfalls in diesem Repository zur Verfügung gestellt, damit Sie CAPICE in Ihrer eigenen Umgebung ausführen können.Die folgenden Abschnitte führen Sie durch die Schritte, die für die Variantenannotation und die Durchführung von Vorhersagen mit dem CAPICE-Modell erforderlich sind.

Voraussetzungen

Python 3.6 (funktioniert nicht mit 3.7 oder 3.8)

Downloads, Installation und Verarbeitung der Eingabedateien

  1. Software und BibliothekenCAPICE-Skripte können vom CAPICE-Github-Repository heruntergeladen werden. Das CAPICE-Modell kann über #tbd
git clone https://github.com/molgenis/capice.gitcd capice
  1. Variantenbeschriftung und EingabedateiformatCAPICE verwendet dieselben Funktionen, die auch in CADD verwendet werden. In diesem Repository stellen wir auch eine Beispiel-Eingangsvariantenliste in CAPICE_example/test_input.vcf und die annotierte Eingabedatei in CAPICE_example/test_caddAnnotated.tsv.gz zur Verfügung

  2. Vorhersage durchführenWenn die annotierte Datei fertig ist, würde der letzte Schritt darin bestehen, das im Github-Repository bereitgestellte vortrainierte Modell zu verwenden.

bash predict.sh \/path/to/input \/path/to/CAPICE_model \/path/to/output \/path/to/log_file

Schreibe einen Kommentar