molgenis / capice

CAPICE är en beräkningsmetod för att förutsäga patogeniciteten hos SNV:er och InDels.Det är en gradient boosting-trädmodell som tränas med hjälp av olika genomiska annotationer som används avCADD-poängen och som tränas på klinisk betydelse. CAPICE fungerar konsekvent i olika oberoende syntetiska och verkliga kliniska datamängder. Den är den för närvarande bästa metoden för uppskattning av patogenicitet för varianter med olika molekylära konsekvenser och allelfrekvens.

Programmet kan användas som webbtjänst, som förberäknade resultat eller genom att installera programmet lokalt, vilket beskrivs nedan.

Använd webbtjänst online

CAPICE kan användas som onlinetjänst på http://molgenis.org/capice

Ladda ner filer med förberäknade poäng för alla möjliga SNV:er och InDels (baserat på GrCh37)

Vi har förberäknat CAPICE-poängen för alla möjliga SNV:er och InDels. Den kan laddas ner via zenodo.

Filen innehåller följande kolumner:#CHROM kromosomnamn, som POS genomisk position (GrCh37 genome assembly)REF referensallelALT alternativ allelescore CAPICE score. Poängen sträcker sig från 0 till 1, ju högre desto mer sannolikt är det att varianten är patogen

Installera CAPICE-programvaran lokalt

CAPICE-programvaran finns också i detta arkiv för att du ska kunna köra CAPICE i din egen miljö.Följande avsnitt kommer att vägleda dig genom de steg som behövs för annotering av varianter och utförandet av att göra förutsägelser med hjälp av CAPICE-modellen.

Krav

Python 3.6 (fungerar inte med 3.7 eller 3.8)

Nedladdning, installation och bearbetning av indatafiler

  1. Mjukvara och bibliotekCAPICE-skript kan laddas ner från CAPICE:s github-arkiv. CAPICE-modellenkan laddas ner via #tbd
git clone https://github.com/molgenis/capice.gitcd capice
  1. Variantannotation och inmatningsfilformatCAPICE använder samma uppsättning funktioner som används i CADD. I detta arkiv tillhandahåller vi också en exempelvariantlista i CAPICE_example/test_input.vcf och den annoterade inmatningsfilen i CAPICE_example/test_caddAnnotated.tsv.gz

  2. Upprätta prediktionNär den annoterade filen är klar är det sista steget att använda den förtränade modellen som tillhandahålls i github-arkivet.

bash predict.sh \/path/to/input \/path/to/CAPICE_model \/path/to/output \/path/to/log_file

Lämna en kommentar