molgenis / capice

CAPICE is een computationele methode voor het voorspellen van de pathogeniciteit van SNVs en InDels.Het is een gradient boosting tree model getraind met behulp van een verscheidenheid van genomische annotaties gebruikt doorCADD score en getraind op de klinische significantie. CAPICE presteert consistent in diverse onafhankelijke synthetische en echte klinische datasets. Het presteert de huidige beste methode in pathogeniciteit schatting voor varianten van verschillende moleculaire gevolgen en allel frequentie.

De software kan worden gebruikt als web service, als vooraf berekende scores of door het installeren van de software lokaal, alle hieronder beschreven.

Online web service

CAPICE kan als online service worden gebruikt op http://molgenis.org/capice

Download bestanden met voorgecomputerde scores voor alle mogelijke SNV’s en InDels (gebaseerd op GrCh37)

Wij hebben de CAPICE-score voor alle mogelijke SNV’s en InDels voorgecomputeerd. Het kan worden gedownload via zenodo.

Het bestand bevat de volgende kolommen:#CHROM chromosoomnaam, als POS genomische positie (GrCh37 genoomassemblage)REF referentie allelALT alternatief allelescore CAPICE score. De score varieert van 0 tot 1, hoe hoger de kans dat de variant pathogeen is

Installeer CAPICE software lokaal

De CAPICE software is ook beschikbaar in deze repository om CAPICE in uw eigen omgeving te draaien. De volgende secties leiden u door de stappen die nodig zijn voor de variant annotatie en de uitvoering van het maken van voorspellingen met behulp van het CAPICE model.

Vereisten

Python 3.6 (werkt niet met 3.7 of 3.8)

Downloads, installatie en verwerking van de invoerbestanden

  1. Software en bibliothekenCAPICE scripts kunnen worden gedownload van de CAPICE github repository. Het CAPICE-model kan worden gedownload via #tbd
git clone https://github.com/molgenis/capice.gitcd capice
  1. Variantannotatie en invoerbestandsformaatCAPICE maakt gebruik van dezelfde set kenmerken die in CADD worden gebruikt. In deze databank vindt u ook een voorbeeld van een invoervariantenlijst in CAPICE_example/test_input.vcf en het geannoteerde invoerbestand in CAPICE_example/test_caddAnnotated.tsv.gz

  2. Voorspelling uitvoerenAls het geannoteerde bestand eenmaal klaar is, bestaat de laatste stap uit het gebruik van het vooraf getrainde model dat in de github-bank is opgenomen.

Plaats een reactie