molgenis / capice

CAPICE é um método computacional para prever a patogenicidade dos SNVs e do InDels. É um modelo de árvore de reforço de gradiente treinado usando uma variedade de anotações genômicas usadas pelo escore doCADD e treinado na significância clínica. O CAPICE tem um desempenho consistente em diversos conjuntos de dados sintéticos independentes e clínicos reais. Ele tem o melhor desempenho atual em estimativa de patogenicidade para variantes de diferentes conseqüências moleculares e freqüência de alelos.

O software pode ser usado como serviço web, como escores pré-calculados ou instalando o software localmente, tudo descrito abaixo.

Utilizar o serviço web online

CAPICE pode ser utilizado como serviço online em http://molgenis.org/capice

Fazer o download de arquivos de escores pré-calculados para todas as SNVs e InDels possíveis (baseados em GrCh37)

Pré-calculamos o escore CAPICE para todas as SNVs e InDels possíveis. Ele pode ser baixado via zenodo.

O arquivo contém as seguintes colunas:#CHROM nome do cromossomo, como posição genômica POS (GrCh37 genome assembly)REF aleloleALT referência aleleALT escore alternativo CAPICE. A pontuação varia de 0 a 1, quanto maior a probabilidade da variante ser patogénica

Instale o software CAPICE localmente

O software CAPICE também é fornecido neste repositório para executar o CAPICE no seu próprio ambiente. As secções seguintes irão guiá-lo através dos passos necessários para a anotação da variante e a execução de previsões usando o modelo CAPICE.

Requisitos

Python 3.6 (não funciona com 3.7 ou 3.8)

Downloads, instalação e processamento dos arquivos de entrada

  1. Software e bibliotecasCAPICE scripts podem ser baixados do repositório CAPICE github. O modelo CAPICE pode ser baixado via #tbd
git clone https://github.com/molgenis/capice.gitcd capice
  1. Variant annotation and input file formatCAPICE usa o mesmo conjunto de recursos usados no CADD. Neste repositório também fornecemos uma lista de exemplos de variantes de entrada em CAPICE_example/test_input.vcf e o arquivo de entrada anotado em CAPICE_example/test_caddAnnotated.tsv.gz

  2. Previsão de desempenhoO arquivo anotado está pronto, então o último passo seria usar o modelo pré-treinado fornecido no repositório github.

bash predict.sh \/path/to/input \/path/to/CAPICE_model \/path/to/output \/path/to/log_file

Deixe um comentário