molgenis / capice

CAPICE è un metodo computazionale per prevedere la patogenicità di SNVs e InDels.It è un modello ad albero gradient boosting addestrato utilizzando una varietà di annotazioni genomiche utilizzate dal punteggioCADD e addestrato sulla rilevanza clinica. CAPICE esegue in modo coerente attraverso diversi set di dati sintetici indipendenti e clinici reali. È il nostro migliore metodo attuale nella stima della patogenicità per varianti di diverse conseguenze molecolari e frequenza allelica.

Il software può essere utilizzato come servizio web, come punteggi precompilati o installando il software localmente, tutti descritti di seguito.

Usa il servizio web online

CAPICE può essere usato come servizio online all’indirizzo http://molgenis.org/capice

Scarica i file dei punteggi precompilati per tutti i possibili SNV e InDel (basato su GrCh37)

Abbiamo precompilato il punteggio CAPICE per tutti i possibili SNV e InDel. Può essere scaricato tramite zenodo.

Il file contiene le seguenti colonne:#CHROM nome del cromosoma, come POS posizione genomica (assemblaggio del genoma GrCh37)REF allele di riferimentoALT allele alternativoescore CAPICE score. Il punteggio varia da 0 a 1, più alto è più è probabile che la variante sia patogena

Installa il software CAPICE localmente

Il software CAPICE è anche fornito in questo repository per eseguire CAPICE nel tuo ambiente.Le sezioni seguenti ti guideranno attraverso i passi necessari per l’annotazione delle varianti e l’esecuzione delle previsioni utilizzando il modello CAPICE.

Requisiti

Python 3.6 (non funziona con 3.7 o 3.8)

Download, installazione ed elaborazione dei file di input

  1. Software e librerieGli script CAPICE possono essere scaricati dal repository github di CAPICE. Il modello CAPICE può essere scaricato tramite #tbd
git clone https://github.com/molgenis/capice.gitcd capice
  1. Annotazione delle varianti e formato dei file di inputCAPICE usa lo stesso set di caratteristiche usate in CADD. In questo repository forniamo anche una lista di varianti di esempio in CAPICE_example/test_input.vcf e il file di input annotato in CAPICE_example/test_caddAnnotated.tsv.gz

  2. Performare la predizioneUna volta che il file annotato è pronto, l’ultimo passo sarebbe utilizzare il modello pre-addestrato fornito nel repository github.

bash predict.sh \/path/to/input \/path/to/CAPICE_model \/path/to/output \/path/to/log_file

Lascia un commento