CAPICE è un metodo computazionale per prevedere la patogenicità di SNVs e InDels.It è un modello ad albero gradient boosting addestrato utilizzando una varietà di annotazioni genomiche utilizzate dal punteggioCADD e addestrato sulla rilevanza clinica. CAPICE esegue in modo coerente attraverso diversi set di dati sintetici indipendenti e clinici reali. È il nostro migliore metodo attuale nella stima della patogenicità per varianti di diverse conseguenze molecolari e frequenza allelica.
Il software può essere utilizzato come servizio web, come punteggi precompilati o installando il software localmente, tutti descritti di seguito.
Usa il servizio web online
CAPICE può essere usato come servizio online all’indirizzo http://molgenis.org/capice
Scarica i file dei punteggi precompilati per tutti i possibili SNV e InDel (basato su GrCh37)
Abbiamo precompilato il punteggio CAPICE per tutti i possibili SNV e InDel. Può essere scaricato tramite zenodo.
Il file contiene le seguenti colonne:#CHROM nome del cromosoma, come POS posizione genomica (assemblaggio del genoma GrCh37)REF allele di riferimentoALT allele alternativoescore CAPICE score. Il punteggio varia da 0 a 1, più alto è più è probabile che la variante sia patogena
Installa il software CAPICE localmente
Il software CAPICE è anche fornito in questo repository per eseguire CAPICE nel tuo ambiente.Le sezioni seguenti ti guideranno attraverso i passi necessari per l’annotazione delle varianti e l’esecuzione delle previsioni utilizzando il modello CAPICE.
Requisiti
Python 3.6 (non funziona con 3.7 o 3.8)
Download, installazione ed elaborazione dei file di input
- Software e librerieGli script CAPICE possono essere scaricati dal repository github di CAPICE. Il modello CAPICE può essere scaricato tramite #tbd
git clone https://github.com/molgenis/capice.gitcd capice
-
Annotazione delle varianti e formato dei file di inputCAPICE usa lo stesso set di caratteristiche usate in CADD. In questo repository forniamo anche una lista di varianti di esempio in CAPICE_example/test_input.vcf e il file di input annotato in CAPICE_example/test_caddAnnotated.tsv.gz
-
Performare la predizioneUna volta che il file annotato è pronto, l’ultimo passo sarebbe utilizzare il modello pre-addestrato fornito nel repository github.
bash predict.sh \/path/to/input \/path/to/CAPICE_model \/path/to/output \/path/to/log_file