Abstract
Circos-plotteja käytetään laajalti moniulotteisen seuraavan sukupolven genomitiedon esittämiseen, mutta nykyiset Circos-toteutukset eivät ole vuorovaikutteisia, ja ne tukevat vain rajoitetusti eri tietotyyppejä. Tässä kehitimme seuraavan sukupolven Circosin (NG-Circos), joustavan JavaScript-pohjaisen ympyränmuotoisen genomin visualisointityökalun, jolla voidaan suunnitella erittäin interaktiivisia Circos-plotteja käyttäen 21 toiminnallista moduulia eri tietotyypeillä. Tietojemme mukaan NG-Circos on tehokkain ohjelmisto interaktiivisten Circos-kuvioiden rakentamiseen. Tukemalla erilaisia tietotyyppejä dynaamisessa selainkäyttöliittymässä NG-Circos nopeuttaa seuraavan sukupolven datan visualisointia ja tulkintaa ja edistää siten toistettavissa olevaa tutkimusta biolääketieteen alalla ja sen ulkopuolella. NG-Circos on saatavilla osoitteissa https://wlcb.oit.uci.edu/NG-Circos ja https://github.com/YaCui/NG-Circos.
YHTEENVETO
Tulevan sukupolven biologisen datan kasvavien määrien visualisointi on ratkaisevan tärkeää tällaisen datan tulkinnan kannalta. Circos-plotit ovat pyöreitä kaksiulotteisia visuaalisia esityksiä, jotka tarjoavat kattavan ratkaisun moniulotteisen genomitiedon esittämiseen ja tulkintaan. Circos-ohjelmistoa (1), joka on pääasiallinen työkalu Circos-plottien tekemiseen, on käytetty monissa tutkimuksissa villisti monimutkaisten biologisten tietojen visualisointiin. Circosin tuotokset eivät kuitenkaan ole interaktiivisia. Muut Circos-työkalut, kuten Circoletto (2), CIRCUS (3), J-Circos (4), shinyCircos (5), Rcircos (6), Circleator (7), OmicCircos (8) ja ggbio (9), eivät joko pysty tuottamaan vuorovaikutteisia Circos-plotteja selaimessa tai ne on rajattu tiettyihin tietotyyppeihin. Aiemmin kehittämämme työkalu, BioCircos.js (10), näyttää olevan ainoa julkaistu ohjelmisto, joka pystyy tuottamaan interaktiivisia Circos-kuvioita, ja siitä on tullut alan uusin työkalu (11-12). BioCircos.js (10) toteuttaa kuitenkin vain yhdeksän toiminnallista moduulia, mikä rajoittaa sen mahdollisuuksia suorittaa muita analyyttisiä tehtäviä.
Tämän heikkouden korjaamiseksi kehitimme tässä seuraavan sukupolven Circos-ohjelman (NG-Circos), joka on JavaScript-pohjainen ympyränmuotoisen genomin visualisointityökalu, joka ulottuu BioCircos.js:n (10) kehystä pidemmälle integroimaan ja tulkitsemaan genomitietotyyppejä vuorovaikutteisten Circos-plottien avulla. NG-Circos sisältää tällä hetkellä 21 moduulia, jotka mahdollistavat erilaisia toimintoja, jotka puuttuivat muista työkaluista (mukaan lukien BioCircos.js (10)). Tukemalla erilaisia genomitietotyyppejä interaktiivisessa selainkäyttöliittymässä NG-Circos nopeuttaa seuraavan sukupolven datan visualisointia ja tulkintaa ja edistää siten toistettavissa olevaa tutkimusta biolääketieteissä ja muualla.
MATERIAALIT JA MENETELMÄT
NG-Circosin toteuttaminen
NG-Circos on kirjoitettu JavaScriptillä ja se tuottaa vuorovaikutteista grafiikkaa SVG-elementin avulla perustuen D3.js:iin (datavetoinen dokumenttipohjainen dokumenttipohja) ja jQuery.js:ään. Koska NG-Circos perustuu JavaScriptiin, sitä voidaan käyttää ilman lisäpakettien asentamista. Kun NG-Circos on ladattu, käyttäjät voivat toistaa lähes kaikki Circosin piirtämät ympyränmuotoiset piirrokset verkkoselaimella. Huomaa, että NG-Circos itsessään ei ole web-sovellus, vaan kirjasto interaktiivisten Circos-plottien rakentamiseen web-sovelluksissa.
Kuvanlataustoiminnon toteuttaminen NG-Circosissa
NG-Circosin lataustoiminto on rakennettu käyttäen The New York Timesin svg-crowbar.js:ää (https://nytimes.github.io/svg-crowbar/). NG-Circos tukee nyt SVG- ja PNG-formaatteja. SVG-kuvamuodon avulla käyttäjät voivat poimia korkealaatuisia kuvia, joita voidaan hyödyntää edelleen Adobe Illustratorissa.
Syöttötietojen käsittely NG-Circosissa
Tarjoamme tietojenkäsittelyskriptin (joka on kirjoitettu pythonilla ja shellillä) raakadatan käsittelyyn, jonka avulla käyttäjät voivat helposti muuntaa tietonsa JSON-muotoon, jossa on oletusarvoiset parametrit vastaavalle moduulille. Erityisesti NG-Circosin syöttötiedot voidaan tuottaa joko tukevilla python-skripteillä tai suoraan hyvin dokumentoitujen JSON-tietoformaattien kautta. Käyttäjät voivat integroida NG-Circosin olemassa olevaan JavaScript-pohjaiseen verkkosovellukseen, jolla on omat sisäiset JSON-tietorakenteensa. Annamme jokaisesta moduulista esimerkin, joka havainnollistaa syöttötietorakennetta ja kaikkia vaiheita, joita tarvitaan esimerkin luomiseen uudelleen (https://wlcb.oit.uci.edu/modules/).
GWAS-datan käsittely LocusZoom-plotissa
Kuvassa 1F käytimme PLINK:ia (13) laskeaksemme tiettyjen populaatioiden r-neliöarvon ja poimiaksemme rekombinaatiomäärän Hapmap3-datasta (14) määritellyille SNP:ille.
NG-Circosin tukemat verkkoselaimet
NG-Circosin ajonopeus riippuu selainten ja laitteiston laskentatehosta. NG-Circos on läpäissyt virheenkorjauksen ja tarkastuksen kaikissa tärkeimmissä internet-selaimissa, mukaan lukien Google Chrome, Internet Explorer/Edge, Mozilla Firefox, Safari ja Opera.
TULOKSET
NG-Circosin työnkulku
NG-Circosilla on erittäin käyttäjäystävällinen työnkulku. Siinä on kolme päävaihetta interaktiivisen Circos-piirroksen piirtämiseen: Vaihe 1 sisältää kromosomien (tai muiden segmenttien) piirtämisen koordinaattiakseleiksi. Vaiheeseen 2 kuuluu erilaisten tietoratojen lisääminen käyttämällä asiaankuuluvia moduuleja, jotka ovat hyvin joustavia moduulivalinnoissa (tällä hetkellä on toteutettu 21 moduulia, lisätaulukko S1). NG-Circosin syöttötiedot voidaan tuottaa joko tukevilla python-skripteillä tai suoraan hyvin dokumentoitujen JSON-dataformaattien avulla. Jokaisesta moduulista annetaan yksi esimerkki, joka sisältää syöttötietotiedostot ja kaikki vaiheet kyseisen esimerkin luomiseen (https://wlcb.oit.uci.edu/modules/). Lopuksi vaihe 3 sisältää vuorovaikutteisia animaatioita, hiiritapahtumia (lisätaulukko S2) ja graafisten elementtien työkalulaatikoiden suunnittelua. NG-Circos on hyvin muokattavissa, joten käyttäjät voivat säätää henkilökohtaisia asetuksia. Tarjoamme myös joukon huolellisesti arvioituja oletusasetuksia kullekin moduulille ja monia demoja, jotta NG-Circos olisi helppokäyttöinen. Lisäksi NG-Circosin valmiuksia voidaan yksinkertaisesti laajentaa sisällyttämällä siihen lisää toiminnallisia moduuleja vaiheessa 2.
NG-Circos tarjoaa joustavia moduulivalintoja monipuolisille Circos-ploteille
NG-Circosin nykyinen versio koostuu 21 moduulista (lisätaulukko S1). NG-Circosin moduulien yhdistäminen antaa käyttäjille mahdollisuuden rakentaa erityyppisiä Circos-plotteja. NG-Circos voi esimerkiksi jäljentää monimutkaisia julkaistuja Circos-plotteja (15) yhdistämällä ARC-, GENE-, HEATMAP-, LINK- ja WIG-moduulit (kuva 1A). NG-Circos ei ainoastaan pysty toistamaan monimutkaisia julkaistuja Circos-plotteja, vaan se voi myös tehdä lisätoimintoja, kuten tarjota suosittuja interaktiivisia Circos-plotteja (esim. Lollipop-, Wig- ja LocusZoom-plotit (16)), jotka on esitetty kuvissa 1B-F (15) (17) (18) (19) ja joita ei ole nähty muissa työkaluissa. Lisäksi tarjoamme lisää demoja online-sivustolla (https://wlcb.oit.uci.edu/NG-Circos) osoittaaksemme tämän työkalun tehon: käyttäjät voivat helposti korvata demodatan omilla tiedoillaan tuottaakseen omia plottejaan. Kaikki luvut ovat ladattavissa SVG- ja PNG-muodossa, jossa SVG-muoto antaa käyttäjille korkealaatuisia kuvia, joita voidaan hyödyntää edelleen muissa sovelluksissa, kuten Adobe Illustratorissa. Kaiken kaikkiaan NG-Circos tarjoaa käyttäjille suurta joustavuutta moduulivalinnoissa ja Circos-plottityypeissä.
Demos of NG-Circos. (A) Monimutkaiset julkaistut Circos-plotit, jotka on toistettu NG-Circosin avulla; yksityiskohtaiset kuvaukset löytyvät Akdemir et al. (15). (B) Demo, jossa geenirakenteet esitetään NG-Circosin avulla; tiedot ovat Akdemir et al. (15). (C) Demo Chord-plotista, joka osoittaa IL-6:n säätelemät geenimuutokset eri soluissa (17). (D) Demo NG-Circos-ohjelmalla suunnitellusta Lollipop-plotista; tiedot ovat Schultheis et al. (18). (E) Demo NG-Circosin COMPARE-moduulista. PVT1-promoottorin mutaatiot muuttavat tehostimen kohdegeenejä. Perukekaavio esittää H3K4me3- (sininen) ja H3K9me3-modifikaatiot (punainen) (19). (F) Demo NG-Circosin suunnittelemasta LocusZoom-plotista. Kappaleiden (A-F) moduulien nimet on merkitty punaisella tekstillä.
NG-Circosin demot. (A) Monimutkaiset julkaistut Circos-plotit, jotka on toistettu NG-Circosin avulla; yksityiskohtaiset kuvaukset löytyvät Akdemir et al. (15). (B) Demo, jossa geenirakenteet esitetään NG-Circosin avulla; tiedot ovat Akdemir et al. (15). (C) Demo Chord-plotista, joka osoittaa IL-6:n säätelemät geenimuutokset eri soluissa (17). (D) Demo NG-Circos-ohjelmalla suunnitellusta Lollipop-plotista; tiedot ovat Schultheis et al. (18). (E) Demo NG-Circosin COMPARE-moduulista. PVT1-promoottorin mutaatiot muuttavat tehostimen kohdegeenejä. Perukekaavio esittää H3K4me3- (sininen) ja H3K9me3-modifikaatiot (punainen) (19). (F) Demo NG-Circosin suunnittelemasta LocusZoom-plotista. Kappaleiden (A-F) moduulien nimet on merkitty punaisella tekstillä.
Tapaustutkimus vuorovaikutteisesta datan tutkimisesta NG-Circosin avulla
Tässä esittelemme tapaustutkimuksen, joka havainnollistaa edelleen vuorovaikutteisen datan tutkimisen tehoa NG-Circosin avulla. Tässä tapauksessa käyttäjät voivat vuorovaikutteisesti tutkia kuljettajien yhden nukleotidin polymorfismeja (SNP), geenifuusioita ja niiden vaikutusta proteiinien rakenteeseen keuhkosyövässä (kuva 2). Esimerkiksi hiirellä tapahtumat näyttävät keuhkosyövän SNP-taajuudet COSMIC-tietokannasta (Catalogue of Somatic Mutations in Cancer) (kuva 2B) (20) ja EML4-ALK-geenifuusion kolmiulotteisen (3D) proteiinirakenteen (kuva 2C) (21). Huomionarvoista on, että NG-Circos voi myös ohjata elementtejä (kuten SNP:tä tai geenifuusioita) ulkoisiin resursseihin. Esimerkiksi klikkaamalla SNP:tä, kuten EGFR:n T790M-muunnosta, avautuu uusi Protein Data Bank (PDB) -tietokannan verkkosivu, jossa näytetään T790M-muunnoksen aiheuttama EGFR:n 3D-rakenne (kuva 2D; PDB-koodi: 2JIT) (22). Yhteenvetona voidaan todeta, että NG-Circos toimii loistavana työkaluna genomitiedon interaktiiviseen tutkimiseen siten, että käyttäjät voivat poimia lisätietoa hiiren liikuttelemalla ja klikkaamalla piirroksia.
NG-Circosin käyttäminen integroivaan tiedon visualisointiin ja tulkintaan. (A) NG-Circosin eri moduulien joustava yhdistäminen useiden biologisten tietotyyppien visualisoimiseksi. Ulompi rengas edustaa kromosomi-ideogrammeja. Ulommasta renkaasta sisäänpäin siirryttäessä tietoradat edustavat somaattisia CNV:itä, muunnostiheyttä, somaattisia mutaatioita ja geenifuusioita. Simuloituja varianttitiheystietoja lukuun ottamatta kaikki esitetyt tiedot on ladattu COSMIC-tietokannasta. (B) Näytä kunkin SNP:n yksityiskohdat hiirellä. (C) Näytä kunkin geenifuusion ja sen 3D-proteiinirakenteen (tässä tapauksessa EML4-ALK-geenifuusio) yksityiskohdat hiirellä. (D) Klikkaa SNP:tä (tässä tapauksessa EGFR:n T790M-variantti) avataksesi uuden verkkosivun PDB-tietokannassa, jossa näytetään EGFR:n T790M-variantin aiheuttama 3D-rakenne (PDB-koodi: 2JIT).
NG-Circos-ohjelmiston käyttö integroivaan datan visualisointiin ja tulkintaan. (A) NG-Circosin eri moduulien joustava yhdistäminen useiden biologisten tietotyyppien visualisoimiseksi. Ulompi rengas edustaa kromosomi-ideogrammeja. Ulommasta renkaasta sisäänpäin siirryttäessä tietoradat edustavat somaattisia CNV:itä, muunnostiheyttä, somaattisia mutaatioita ja geenifuusioita. Simuloituja varianttitiheystietoja lukuun ottamatta kaikki esitetyt tiedot on ladattu COSMIC-tietokannasta. (B) Näytä kunkin SNP:n yksityiskohdat hiirellä. (C) Näytä kunkin geenifuusion ja sen 3D-proteiinirakenteen (tässä tapauksessa EML4-ALK-geenifuusio) yksityiskohdat hiirellä. (D) Klikkaa SNP:tä (tässä tapauksessa EGFR:n T790M-variantti) avataksesi uuden verkkosivun PDB-tietokannassa, jossa näytetään EGFR:n T790M-variantin aiheuttama 3D-rakenne (PDB-koodi: 2JIT).
KESKUSTELU
Interaktiivinen datan tutkiminen eri tietotyypeissä edistää varmasti seuraavan sukupolven datan visualisointia ja tulkintaa, ja syöpätutkimuksessa on nähty joitakin onnistuneita esimerkkejä, kuten cBioPortal (23). Circos-plotteja käytetään laajalti mittavien seuraavan sukupolven genomitietojen esittämiseen, mutta nykyiset Circos-toteutukset eivät tuota interaktiivisia tuotoksia, mikä haittaa sen käytettävyyttä. Tämän ongelman ratkaisemiseksi NG-Circos tarjoaa joustavia moduulivaihtoehtoja interaktiiviseen datan tutkimiseen ja erilaisia Circos-plotteja. Kun tulevaisuudessa tuotetaan uusia genomitietotyyppejä, päivitämme jatkuvasti uusia toiminnallisia moduuleja NG-Circosin tehon laajentamiseksi. Ylläpidämme myös aktiivisesti NG-Circosia ja vastaamme käyttäjien tiedusteluihin. Tukemalla erilaisia genomitietotyyppejä vuorovaikutteisessa web-käyttöliittymässä NG-Circos tulee uskoaksemme tulevaisuudessa tehostamaan genomitutkimusta biolääketieteen alalla.
LISÄTIETOJA
Lisätiedot ovat saatavilla osoitteessa NARGAB Online.
LÄHTEET
Kiitämme Tianyi Zangia, Yadong Wangia ja Li-laboratorion jäseniä rakentavista keskusteluista ja tuesta.
RAHOITUS
Ei ulkopuolista rahoitusta.
Esintressiristiriitojen selvitys. None declared.
,
,
,
,
,
,
,
.
;
:
–
.
kanssa.
.
;
:
–
.
,
,
,
.
.
;
:
.
,
,
,
,
,
.
.
;
:
–
.
,
,
.
.
;
:
–
.
,
,
.
.
;
:
.
,
,
,
,
,
.
.
;
:
–
.
,
,
,
,
,
.
;
:
–
.
,
,
.
;
:
.
,
,
,
,
,
,
,
,
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
ja muut.
.
.
;
:
.
,
,
,
,
,
,
,
,
,
ja muut.
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
j.a.n.e. .
.
;
:
–
.
,
,
,
,
,
,
,
,
,
ja muut.
.
.
;
:
–
.
,
,
,
,
,
,
,
.
;
:
–
.
,
,
,
,
,
,
,
,
,
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
ja muut.
.
;
:
–
.
,
,
,
,
,
,
,
,
.
;
:
–
.
,
,
,
,
,
,
,
,
,
j.n.e. .
.
.
;
:
–
.
,
,
,
,
,
,
,
,
,
et al.
.
;
:
–
.
,
,
,
,
,
,
.
;
:
.
,
,
,
,
,
,
;
:
–
.
,
,
,
,
,
,
,
,
,
jne .
.
;
:
.
,
,
,
,
,
,
,
,
,
.
.
;
:
.
,
,
,
,
,
.
;
:
–
.
,
,
,
,
,
,
,
,
,
.
;
:
–
.
Tekijän huomautukset
Tekijät toivovat, että tiedetään, että heidän mielestään kahta ensimmäistä kirjoittajaa tulisi pitää yhteisinä ensimmäisinä kirjoittajina.
.