CAPICE er en beregningsmetode til forudsigelse af SNV’ers og InDels patogenicitet.Det er en gradient boosting-træmodel, der er trænet ved hjælp af en række genomiske annotationer, der anvendes afCADD-score og trænet på den kliniske signifikans. CAPICE fungerer konsekvent på tværs af forskellige uafhængige syntetiske og reelle kliniske datasæt. Den er den bedste metode til vurdering af patogenicitet for varianter med forskellige molekylære konsekvenser og allelfrekvenser.
Softwaren kan anvendes som webtjeneste, som forudberegnede scorer eller ved at installere softwaren lokalt, som alle er beskrevet nedenfor.
Brug online webtjeneste
CAPICE kan bruges som onlinetjeneste på http://molgenis.org/capice
Download filer med forudberegnede scorer for alle mulige SNV’er og InDels (baseret på GrCh37)
Vi har forudberegnet CAPICE-scoren for alle mulige SNV’er og InDels. Den kan downloades via zenodo.
Filen indeholder følgende kolonner:#CHROM kromosomnavn, som POS genomisk position (GrCh37-genomsamlingen)REF referenceallelALT alternativ allelescore CAPICE-score. Scoren går fra 0 til 1, jo højere jo mere sandsynligt er det, at varianten er patogen
Installer CAPICE-softwaren lokalt
CAPICE-softwaren findes også i dette arkiv, så du kan køre CAPICE i dit eget miljø.De følgende afsnit vil guide dig gennem de trin, der er nødvendige for variantannotationen og udførelsen af forudsigelser ved hjælp af CAPICE-modellen.
Krav
Python 3.6 (virker ikke med 3.7 eller 3.8)
Download, installation og behandling af inputfiler
- Software og bibliotekerCAPICE-scripts kan downloades fra CAPICE github-repositoriet. CAPICE-modellenkan downloades via #tbd
git clone https://github.com/molgenis/capice.gitcd capice
-
Variant annotation og inputfilformatCAPICE anvender det samme sæt funktioner, som anvendes i CADD. I dette repositorium leverer vi også et eksempel på en liste over inputvarianter i CAPICE_example/test_input.vcf og den annoterede inputfil i CAPICE_example/test_caddAnnotated.tsv.gz
-
Udfør forudsigelseNår den annoterede fil er klar, vil det sidste trin være at bruge den forud trænede model, der leveres i github-repositoriet.
bash predict.sh \/path/to/input \/path/to/CAPICE_model \/path/to/output \/path/to/log_file