CAPICE on laskennallinen menetelmä SNV:iden ja InDelien patogeenisuuden ennustamiseen.Se on gradienttiboosting-puumalli, joka on koulutettu käyttäen erilaisia genomisia annotaatioita, joita käytetäänCADD-pisteytyksessä, ja se on koulutettu kliinisen merkityksen perusteella. CAPICE toimii johdonmukaisesti erilaisissa riippumattomissa synteettisissä ja todellisissa kliinisissä tietokokonaisuuksissa. Se on nykyisin paras menetelmä patogeenisuuden arvioinnissa muunnoksille, joilla on erilaiset molekulaariset seuraukset ja alleelifrekvenssi.
Ohjelmistoa voidaan käyttää verkkopalveluna, valmiiksi laskettuina pistemäärinä tai asentamalla ohjelmisto paikallisesti, mikä kaikki on kuvattu jäljempänä.
Verkkopalvelun käyttö
CAPICEa voi käyttää verkkopalveluna osoitteessa http://molgenis.org/capice
Lataa tiedostot esilasketuista pisteytyksistä kaikille mahdollisille SNV:ille ja InDeleille (GrCh37:n perusteella)
Laskimme CAPICE-pisteet esilaskettuina kaikille mahdollisille SNV:ille ja InDeleille. Se on ladattavissa zenodon kautta.
Tiedosto sisältää seuraavat sarakkeet:#CHROM kromosomin nimi, as POS genomic position (GrCh37 genomikokoonpano)REF referenssialleeliALT vaihtoehtoinen alleelicore CAPICE score. Pistemäärä vaihtelee 0:sta 1:een, mitä korkeampi, sitä todennäköisemmin variantti on patogeeninen
Asenna CAPICE-ohjelmisto paikallisesti
Tämässä arkistossa on myös CAPICE-ohjelmisto, jonka avulla voit ajaa CAPICEa omassa ympäristössäsi.Seuraavissa osioissa opastetaan sinua vaiheissa, joita tarvitaan varianttien annotaatioon ja ennusteiden tekemiseen CAPICE-mallin avulla.
Vaatimukset
Python 3.6 (ei toimi 3.7:llä tai 3.8:lla)
Lataukset, asennus ja syötetiedostojen käsittely
- Ohjelmisto ja kirjastotCAPICE-skriptit voi ladata CAPICE:n github-arkistosta. CAPICE-mallin voi ladata #tbd
git clone https://github.com/molgenis/capice.gitcd capice
-
Muuttujien merkinnät ja syöttötiedostomuotoCAPICE käyttää samoja ominaisuuksia kuin CADD:ssä. Tässä arkistossa tarjoamme myös esimerkin syöttövarianttiluettelon CAPICE_example/test_input.vcf:ssä ja annotoidun syöttötiedoston CAPICE_example/test_caddAnnotated.tsv.gz:ssä
-
Ennustuksen suorittaminenViimeisenä vaiheena on annotoidun tiedoston valmistuminen, jolloin viimeisenä askeleena käytetään github-arkistossa tarjottua valmiiksi harjoittelemattua mallia.
bash predict.sh \/path/to/input \/path/to/CAPICE_model \/path/to/output \/path/to/log_file