CAPICE jest metodą obliczeniową do przewidywania patogenności SNVs i InDels.It jest gradient boosting modelu drzewa szkolone przy użyciu różnych genomowych adnotacji używanych przezCADD wynik i przeszkolony na znaczeniu klinicznym. CAPICE działa konsekwentnie na różnych, niezależnych, syntetycznych i rzeczywistych zestawach danych klinicznych. Jest to najlepsza obecnie metoda szacowania patogenności dla wariantów o różnych konsekwencjach molekularnych i częstości alleli.
Oprogramowanie może być używane jako usługa sieciowa, jako wstępnie obliczone wyniki lub przez zainstalowanie oprogramowania lokalnie, wszystkie opisane poniżej.
Użyj usługi online
CAPICE może być użyty jako usługa online pod adresem http://molgenis.org/capice
Pobierz pliki wstępnie obliczonych wyników dla wszystkich możliwych SNV i InDels (w oparciu o GrCh37)
Wyliczyliśmy wstępnie wynik CAPICE dla wszystkich możliwych SNV i InDels. Można go pobrać poprzez zenodo.
Plik zawiera następujące kolumny:#CHROM nazwa chromosomu, jako pozycja genomowa POS (złożenie genomu GrCh37)REF allel referencyjnyALT allel alternatywny CAPICE score. Wynik waha się od 0 do 1, im wyższy tym bardziej prawdopodobne, że wariant jest patogenny
Zainstaluj lokalnie oprogramowanie CAPICE
W tym repozytorium znajduje się również oprogramowanie CAPICE umożliwiające uruchomienie CAPICE we własnym środowisku.Poniższe sekcje przeprowadzą Cię przez kroki potrzebne do anotacji wariantów i wykonania przewidywań przy użyciu modelu CAPICE.
Wymagania
Python 3.6 (nie działa z 3.7 lub 3.8)
Pobieranie, instalacja i przetwarzanie plików wejściowych
- Oprogramowanie i bibliotekiSkrypty CAPICE można pobrać z repozytorium CAPICE na githubie. The CAPICE modelcan be downloaded via #tbd
git clone https://github.com/molgenis/capice.gitcd capice
-
Anotacja zmiennych i format plików wejściowychCAPICE używa tego samego zestawu funkcji używanych w CADD. W tym repozytorium udostępniamy również przykładową listę wariantów wejściowych w CAPICE_example/test_input.vcf oraz adnotowany plik wejściowy w CAPICE_example/test_caddAnnotated.tsv.gz
-
Wykonanie predykcjiGdy plik z adnotacjami jest gotowy, ostatnim krokiem jest użycie wstępnie wytrenowanego modelu dostarczonego w repozytorium github.
bash predict.sh \/path/to/input \/path/to/CAPICE_model \/path/to/output \/path/to/log_file
.