CAPICE é um método computacional para prever a patogenicidade dos SNVs e do InDels. É um modelo de árvore de reforço de gradiente treinado usando uma variedade de anotações genômicas usadas pelo escore doCADD e treinado na significância clínica. O CAPICE tem um desempenho consistente em diversos conjuntos de dados sintéticos independentes e clínicos reais. Ele tem o melhor desempenho atual em estimativa de patogenicidade para variantes de diferentes conseqüências moleculares e freqüência de alelos.
O software pode ser usado como serviço web, como escores pré-calculados ou instalando o software localmente, tudo descrito abaixo.
Utilizar o serviço web online
CAPICE pode ser utilizado como serviço online em http://molgenis.org/capice
Fazer o download de arquivos de escores pré-calculados para todas as SNVs e InDels possíveis (baseados em GrCh37)
Pré-calculamos o escore CAPICE para todas as SNVs e InDels possíveis. Ele pode ser baixado via zenodo.
O arquivo contém as seguintes colunas:#CHROM nome do cromossomo, como posição genômica POS (GrCh37 genome assembly)REF aleloleALT referência aleleALT escore alternativo CAPICE. A pontuação varia de 0 a 1, quanto maior a probabilidade da variante ser patogénica
Instale o software CAPICE localmente
O software CAPICE também é fornecido neste repositório para executar o CAPICE no seu próprio ambiente. As secções seguintes irão guiá-lo através dos passos necessários para a anotação da variante e a execução de previsões usando o modelo CAPICE.
Requisitos
Python 3.6 (não funciona com 3.7 ou 3.8)
Downloads, instalação e processamento dos arquivos de entrada
- Software e bibliotecasCAPICE scripts podem ser baixados do repositório CAPICE github. O modelo CAPICE pode ser baixado via #tbd
git clone https://github.com/molgenis/capice.gitcd capice
-
Variant annotation and input file formatCAPICE usa o mesmo conjunto de recursos usados no CADD. Neste repositório também fornecemos uma lista de exemplos de variantes de entrada em CAPICE_example/test_input.vcf e o arquivo de entrada anotado em CAPICE_example/test_caddAnnotated.tsv.gz
-
Previsão de desempenhoO arquivo anotado está pronto, então o último passo seria usar o modelo pré-treinado fornecido no repositório github.
bash predict.sh \/path/to/input \/path/to/CAPICE_model \/path/to/output \/path/to/log_file