molgenis / capice

CAPICE es un método computacional para la predicción de la patogenicidad de SNVs e InDels.Es un modelo de árbol de refuerzo de gradiente entrenado usando una variedad de anotaciones genómicas utilizadas por la puntuaciónCADD y entrenado en la importancia clínica. CAPICE se comporta de forma consistente en diversos conjuntos de datos sintéticos independientes y clínicos reales. Es el mejor método actual para la estimación de la patogenicidad de variantes de diferentes consecuencias moleculares y frecuencias alélicas.

El software puede utilizarse como servicio web, como puntuaciones precalculadas o instalando el software localmente, todo ello descrito a continuación.

Utilizar el servicio web en línea

CAPICE puede utilizarse como servicio en línea en http://molgenis.org/capice

Descargar archivos de puntuaciones precomputadas para todos los posibles SNVs e InDels (basados en GrCh37)

Hemos precomputado la puntuación de CAPICE para todos los posibles SNVs e InDels. Puede descargarse a través de zenodo.

El archivo contiene las siguientes columnas:#CHROM nombre del cromosoma, como posición genómica POS (ensamblaje del genoma GrCh37)REF alelo de referenciaALT alelos alternativospuntuación CAPICE. La puntuación va de 0 a 1, cuanto más alta sea la variante más probable es que sea patógena

Instalar el software CAPICE localmente

El software CAPICE también se proporciona en este repositorio para ejecutar CAPICE en su propio entorno.Las siguientes secciones le guiarán a través de los pasos necesarios para la anotación de variantes y la ejecución dehacer predicciones utilizando el modelo CAPICE.

Requisitos

Python 3.6 (no funciona con 3.7 o 3.8)

Descargas, instalación y procesamiento de los archivos de entrada

  1. Software y bibliotecasLos scripts de CAPICE pueden descargarse desde el repositorio de github de CAPICE. El modelo de CAPICE puede descargarse a través de #tbd
git clone https://github.com/molgenis/capice.gitcd capice
  1. Anotación de variantes y formato de los archivos de entradaCAPICE utiliza el mismo conjunto de características utilizadas en CADD. En este repositorio también proporcionamos una lista de variantes de entrada de ejemplo en CAPICE_example/test_input.vcf y el archivo de entrada anotado en CAPICE_example/test_caddAnnotated.tsv.gz

  2. Realizar la predicciónUna vez que el archivo anotado está listo, el último paso sería utilizar el modelo preentrenado proporcionado en el repositorio de github.

bash predict.sh \/path/to/input \/path/to/CAPICE_model \/path/to/output \/path/to/log_file

Deja un comentario