NG-Circos: next-generation Circos voor datavisualisatie en -interpretatie

Abstract

Circos plots worden veel gebruikt om multi-dimensionale next-generation genomic data weer te geven, maar bestaande implementaties van Circos zijn niet interactief met beperkte ondersteuning van datatypes. Hier hebben we next-generation Circos (NG-Circos) ontwikkeld, een flexibele JavaScript-gebaseerde circulaire genoom visualisatie tool voor het ontwerpen van zeer interactieve Circos plots met behulp van 21 functionele modules met verschillende datatypes. Voor zover wij weten, is NG-Circos de meest krachtige software om interactieve Circos plots te maken. Door het ondersteunen van diverse datatypes in een dynamische browser interface, zal NG-Circos de volgende generatie data visualisatie en interpretatie versnellen, en daarmee het reproduceerbare onderzoek in de biomedische wetenschappen en daarbuiten bevorderen. NG-Circos is beschikbaar op https://wlcb.oit.uci.edu/NG-Circos en https://github.com/YaCui/NG-Circos.

INLEIDING

Visualisatie van toenemende volumes van next-generation biologische data is van cruciaal belang voor de interpretatie van dergelijke data. Circos-plots zijn cirkelvormige tweedimensionale visuele voorstellingen die een uitgebreide oplossing bieden voor de presentatie en interpretatie van multidimensionale genomische gegevens. Circos (1), het belangrijkste instrument voor het maken van Circos plots, is in vele studies op grote schaal gebruikt voor de visualisatie van complexe biologische gegevens. De output van Circos is echter niet interactief. Andere van Circos afgeleide tools, zoals Circoletto (2), CIRCUS (3), J-Circos (4), shinyCircos (5), Rcircos (6), Circleator (7), OmicCircos (8), ggbio (9) zijn ofwel niet in staat om interactieve Circos plots te maken in een web browser of zijn beperkt tot specifieke datatypes. Onze vorige tool, BioCircos.js (10), blijkt de enige gepubliceerde software te zijn die in staat is interactieve Circos plots te maken en is de state-of-the-art tool in het veld geworden (11-12). Niettemin, BioCircos.js (10) implementeert slechts negen functionele modules, waardoor de reikwijdte om extra analytische taken uit te voeren.

Om deze zwakte aan te pakken, hebben we hier next-generation Circos (NG-Circos) ontwikkeld, een JavaScript-gebaseerde circulaire genoom visualisatie tool die verder gaat dan het kader van BioCircos.js (10) om genomische datatypes te integreren en te interpreteren door middel van interactieve Circos plots. NG-Circos bevat momenteel 21 modules die verschillende functies mogelijk maken die in andere tools (waaronder BioCircos.js (10)) ontbraken. Door verschillende genomische datatypes te ondersteunen in een interactieve browser interface, zal NG-Circos de volgende generatie data visualisatie en interpretatie versnellen, en zo reproduceerbaar onderzoek in de biomedische wetenschappen en daarbuiten bevorderen.

MATERIALEN EN METHODEN

Implementatie van NG-Circos

NG-Circos is geschreven in JavaScript en genereert interactieve graphics met SVG element op basis van D3.js (data-driven documents) en jQuery.js. Gebaseerd op JavaScript, kan NG-Circos gebruikt worden zonder extra pakketten te installeren. Na het downloaden van NG-Circos kunnen gebruikers bijna alle cirkelvormige plots getekend door Circos reproduceren met een webbrowser. Merk op dat NG-Circos zelf geen webapplicatie is, maar een bibliotheek om interactieve Circos-plots in webapplicaties te bouwen.

Implementeren van image-download functie in NG-Circos

De download functie in NG-Circos is gebouwd met behulp van de svg-crowbar.js (https://nytimes.github.io/svg-crowbar/) van The New York Times. NG-Circos ondersteunt nu de SVG en PNG formaten. Met het SVG-afbeeldingsformaat kunnen gebruikers afbeeldingen van hoge kwaliteit extraheren die verder kunnen worden gebruikt in Adobe Illustrator.

Invoergegevens verwerken in NG-Circos

Wij bieden een gegevensverwerkingsscript (geschreven door python en shell) voor de verwerking van ruwe gegevens, zodat gebruikers hun gegevens gemakkelijk kunnen omzetten in JSON-formaat met standaardparameters voor de overeenkomstige module. De invoergegevens van NG-Circos kunnen worden gegenereerd door de ondersteunende python-scripts, of rechtstreeks via de goed gedocumenteerde JSON-gegevensformaten. Gebruikers kunnen NG-Circos integreren in een bestaande JavaScript-gebaseerde webapplicatie die zijn eigen interne JSON-gegevensstructuren heeft. We geven een voorbeeld voor elke module om de input datastructuur te illustreren en alle stappen die nodig zijn om dat voorbeeld te recreëren (https://wlcb.oit.uci.edu/modules/).

Verwerking van GWAS-gegevens in LocusZoom plot

In figuur 1F hebben we PLINK (13) gebruikt om de r-kwadraatwaarde van specifieke populaties te berekenen en om het recombinatiepercentage uit de Hapmap3-gegevens (14) te extraheren voor gespecificeerde SNP’s.

Webbrowsers ondersteund door NG-Circos

De snelheid van NG-Circos hangt af van de rekenkracht van browsers en hardware. NG-Circos heeft de debugging en het onderzoek doorstaan in alle belangrijke internetbrowsers waaronder Google Chrome, Internet Explorer/Edge, Mozilla Firefox, Safari en Opera.

RESULTATEN

Workflow van NG-Circos

NG-Circos heeft een zeer gebruikersvriendelijke workflow. Het heeft drie hoofdstappen om een interactieve Circos plot te tekenen: Stap 1 omvat het tekenen van chromosomen (of andere segmenten) als de coördinaatassen. Stap 2 omvat het toevoegen van verschillende data tracks met behulp van de relevante modules met een hoge flexibiliteit in module keuzes (21 modules zijn momenteel geïmplementeerd, Supplementary Table S1). De invoergegevens van NG-Circos kunnen ofwel worden gegenereerd door de ondersteunende python-scripts, ofwel rechtstreeks via de goed gedocumenteerde JSON-gegevensformaten. Voor elke module wordt een voorbeeld gegeven met de invoerbestanden en alle stappen om dat voorbeeld na te maken (https://wlcb.oit.uci.edu/modules/). Tenslotte bevat stap 3 interactieve animaties, mouse events (Supplementary Table S2) en het ontwerpen van toolboxes voor grafische elementen. NG-Circos is in hoge mate aanpasbaar, zodat gebruikers persoonlijke instellingen kunnen aanpassen. We bieden ook een set van zorgvuldig geëvalueerde standaardinstellingen voor elke module en voorzien vele demo’s om NG-Circos gemakkelijk te gebruiken te maken. Bovendien kan de capaciteit van NG-Circos eenvoudig worden uitgebreid door meer functionele modules in stap 2 op te nemen.

NG-Circos biedt flexibele module keuzes voor diverse Circos plots

De huidige versie van NG-Circos bestaat uit 21 modules (Supplementary Table S1). De combinatie van modules in NG-Circos stelt gebruikers in staat om diverse soorten Circos plots te construeren. Bijvoorbeeld, NG-Circos kan reproduceren complexe gepubliceerde Circos plots (15) door het combineren van ARC, GENE, HEATMAP, LINK en WIG modules (figuur 1A). Niet alleen kan NG-Circos complexe gepubliceerde Circos plots reproduceren, maar ook kan het extra functies zoals het verstrekken van populaire interactieve Circos plot demo’s (bijvoorbeeld Lollipop, Wig en LocusZoom (16) plots) getoond in figuur 1B-F (15) (17) (18) (19), die niet worden gezien in andere tools. Bovendien bieden we meer demo’s in de online website (https://wlcb.oit.uci.edu/NG-Circos) om de kracht van dit instrument te laten zien: gebruikers kunnen eenvoudig de demo gegevens te vervangen door hun eigen gegevens om hun eigen plots te produceren. Alle figuren kunnen worden gedownload in SVG- en PNG-formaat, waarbij het SVG-formaat gebruikers afbeeldingen van hoge kwaliteit oplevert die verder kunnen worden gebruikt met andere toepassingen zoals Adobe Illustrator. Over het geheel genomen biedt NG-Circos gebruikers een grote flexibiliteit in de keuze van modules en Circos-plottypes.

Figuur 1.

Demo’s van NG-Circos. (A) Complex gepubliceerde Circos-plots gereproduceerd met NG-Circos; gedetailleerde beschrijvingen zijn te vinden in Akdemir et al. (15). (B) Demo met genstructuren met NG-Circos; gegevens zijn afkomstig van Akdemir et al. (15). (C) Demo van Chord plot met de IL-6-gereguleerde gen veranderingen in verschillende cellen (17). (D) Demo van Lollipop plot ontworpen door NG-Circos; gegevens zijn van Schultheis et al. (18). (E) Demo van COMPARE module in NG-Circos. Mutaties in de PVT1 promotor veranderen enhancer doelgenen. Wig plot toont de H3K4me3 (blauw) en H3K9me3 (rood) modificaties (19). (F) Demo van LocusZoom plot ontworpen door NG-Circos. De module namen van tracks in (A-F) zijn gemarkeerd met rode tekst.

Figuur 1.

Demo’s van NG-Circos. (A) Complex gepubliceerde Circos-plots gereproduceerd met NG-Circos; gedetailleerde beschrijvingen zijn te vinden in Akdemir et al. (15). (B) Demo met genstructuren met NG-Circos; gegevens zijn afkomstig van Akdemir et al. (15). (C) Demo van Chord plot met de IL-6-gereguleerde gen veranderingen in verschillende cellen (17). (D) Demo van Lollipop plot ontworpen door NG-Circos; gegevens zijn van Schultheis et al. (18). (E) Demo van COMPARE module in NG-Circos. Mutaties in de PVT1 promotor veranderen enhancer doelgenen. Wig plot toont de H3K4me3 (blauw) en H3K9me3 (rood) modificaties (19). (F) Demo van LocusZoom plot ontworpen door NG-Circos. De module namen van tracks in (A-F) zijn gemarkeerd met rode tekst.

Casestudie voor interactieve data exploratie met behulp van NG-Circos

Hierbij presenteren we een casestudie om de kracht van interactieve data exploratie met behulp van NG-Circos verder te illustreren. In dit geval kunnen gebruikers op een interactieve manier de driver single nucleotide polymorphisms (SNPs), gen fusies en hun impact op de eiwitstructuur in longkanker verkennen (figuur 2). Bijvoorbeeld, muis over gebeurtenissen tonen de SNP frequenties in longkanker uit de Catalogue of Somatic Mutations in Cancer (COSMIC) database (figuur 2B) (20) en de drie-dimensionale (3D) eiwitstructuur van een EML4-ALK genfusie (figuur 2C) (21). Opmerkelijk is dat NG-Circos ook elementen (zoals SNP’s of genfusies) kan doorverwijzen naar externe bronnen. Door bijvoorbeeld te klikken op een SNP, zoals de EGFR T790M variant, wordt een nieuwe Protein Data Bank (PDB) database webpagina geopend, waarop de door de T790M variant beïnvloede 3D structuur van EGFR te zien is (figuur 2D; PDB code: 2JIT) (22). Kortom, NG-Circos dient als een geweldig hulpmiddel om genomische gegevens interactief te verkennen, zodat gebruikers kunnen extra informatie te extraheren door de muis te zweven en te klikken op de plots.

Figure 2.

Gebruik NG-Circos voor integratieve data visualisatie en interpretatie. (A) Flexibele combinatie van verschillende modules in NG-Circos om meerdere biologische gegevenstypen te visualiseren. De buitenste ring stelt chromosoom ideogrammen voor. Bewegen inward van de buitenste ring, de data tracks vertegenwoordigen somatische CNVs, variant dichtheid, somatische mutaties en gen fusies. Met uitzondering van de gesimuleerde variant dichtheid van gegevens, zijn alle getoonde gegevens gedownload van de COSMIC database. (B) Klik met de muis om de details van elke SNP te tonen. (C) Klik met de muis om de details van elke genfusie en zijn 3D eiwitstructuur te tonen (in dit geval, de EML4-ALK genfusie). (D) Klik op een SNP (in dit geval, de EGFR T790M variant) om een nieuwe webpagina te openen in de PDB database met de T790M variant-beïnvloede 3D structuur van EGFR (PDB code: 2JIT).

Figuur 2.

Gebruik NG-Circos voor integratieve data visualisatie en interpretatie. (A) Flexibele combinatie van verschillende modules in NG-Circos om meerdere biologische datatypes te visualiseren. De buitenste ring stelt chromosoom ideogrammen voor. Bewegen inward van de buitenste ring, de data tracks vertegenwoordigen somatische CNVs, variant dichtheid, somatische mutaties en gen fusies. Met uitzondering van de gesimuleerde variant dichtheid van gegevens, zijn alle getoonde gegevens gedownload van de COSMIC database. (B) Klik met de muis om de details van elke SNP te tonen. (C) Klik met de muis om de details van elke genfusie en zijn 3D eiwitstructuur te tonen (in dit geval, de EML4-ALK genfusie). (D) Klik op een SNP (in dit geval, de EGFR T790M-variant) om een nieuwe webpagina te openen in de PDB-database met de 3D-structuur van de EGFR (PDB-code: 2JIT) die door de T790M-variant is beïnvloed.

DISCUSSIE

Interactieve data-exploratie in diverse gegevenstypen zal de volgende generatie datavisualisatie en -interpretatie zeker bevorderen, met enkele succesvolle voorbeelden, zoals cBioPortal (23), gezien in kankeronderzoek. Circos plots worden op grote schaal gebruikt om volumineuze next-generation genomische data weer te geven, maar bestaande implementaties van Circos genereert geen interactieve output, wat de bruikbaarheid ervan belemmert. Om dit probleem aan te pakken, biedt NG-Circos flexibele modules voor interactieve data-exploratie en diverse Circos-plottypes. Naarmate er in de toekomst meer soorten genomische gegevens worden gegenereerd, zullen we aanvullende functionele modules blijven bijwerken om de kracht van NG-Circos uit te breiden. We zullen NG-Circos ook actief onderhouden en reageren op vragen van gebruikers. Door het ondersteunen van diverse soorten genomische gegevens in een interactieve webinterface, NG-Circos, geloven we, zal genomisch onderzoek in het biomedische veld in de toekomst te verbeteren.

SUPPLEMENTARY DATA

Supplementary Data zijn beschikbaar op NARGAB Online.

ACKNOWLEDGEMENTS

Wij erkennen Tianyi Zang, Yadong Wang en leden van de Li lab voor constructieve discussies en support.

Funding

Geen externe financiering.

Conflict of interest statement. Geen verklaard.

Krzywinski
M.

,

Schein
J.

,

Birol
I.

,

Connors
J.

,

Gascoyne
R.

,

Horsman
D.

,

Jones
S.J.

,

Marra
M.A.
Circos: an information aesthetic for comparative genomics

.

Genome Res.
2009

;

19

:

1639

1645

.

Darzentas
N.
Circoletto: visualiseren van sequentie gelijkenis met Circos

.

Bioinformatica

.

2010

;

26

:

2620

2621

.

Naquin
D.

,

d’Aubenton-Carafa
Y.

,

Thermes
C.

,

Silvain
M.
CIRCUS: a package for Circos display of structural genome variations from paired-end and mate-pair sequencing data

.

BMC Bioinformatics

.

2014

;

15

:

198

.

An
J.

,

Lai
J.

,

Sajjanhar
A.

,

Batra
J.

,

Wang
C.

,

Nelson
C.C.
J-Circos: een interactieve Circos plotter

.

Bioinformatica

.

2015

;

31

:

1463

1465

.

Yu
Y.

,

Ouyang
Y.

,

Yao
W.
ShinyCircos: een R/Shiny toepassing voor interactieve creatie van Circos plot

.

Bioinformatica

.

2018

;

34

:

1229

1231

.

Zhang
H.

,

Meltzer
P.

,

Davis
S.
RCircos: an R package for Circos 2D track plots

.

BMC Bioinformatics

.

2013

;

14

:

244

.

Crabtree
J.

,

Agrawal
S.

,

Mahurkar
A.

,

Myers
G.S.

,

Rasko
D.A.

,

White
O.
Circleator: flexibele circulaire visualisatie van genoom-geassocieerde data met BioPerl en SVG

.

Bioinformatica

.

2014

;

30

:

3125

3127

.

Hu
Y.

,

Yan
C.

,

Hsu
C.H.

,

Chen
Q.R.

,

Niu
K.

,

Komatsoulis
G.A.

,

Meerzaman
D.
Omiccircos: a simple-to-use R package for the circular visualization of multidimensional Omics data

.

Cancer Inform.
2014

;

13

:

13

20

.

Yin
T.

,

Cook
D.

,

Lawrence
M.
ggbio: an R package for extending the grammar of graphics for genomic data

.

Genome Biol.
2012

;

13

:

R77

.

Cui
Y.

,

Chen
X.

,

Luo
H.

,

Fan
Z.

,

Luo
J.

,

He
S.

,

Yue
H.

,

Zhang
P.

,

Chen
R.
BioCircos.js: een interactieve Circos JavaScript bibliotheek voor biologische data visualisatie op web applicaties

.

Bioinformatica

.

2016

;

32

:

1740

1742

.

Juanillas
V.

,

Dereeper
A.

,

Beaume
N.

,

Droc
G.

,

Dizon
J.

,

Mendoza
J.R.

,

Perdon
J.P.

,

Mansueto
L.

,

Triplett
L.

,

Lang
J.

et al.

Rice galaxy: een open bron voor plantenwetenschap

.

Gigascience

.

2019

;

8

:

giz028

.

Nott
A.

,

Holtman
I.R.

,

Coufal
N.G.

,

Schlachetzki
J.C.M.

,

Yu
M.

,

Hu
R.

,

Han
C.Z.

,

Pena
M.

,

Xiao
J.

,

Wu
Y.

et al.

Brain cell type-specific enhancer-promoter interactome maps and disease-risk association

.

Science

.

2019

;

366

:

1134

1139

.

Purcell
S.

,

Neale
B.

,

Todd-Brown
K.

,

Thomas
L.

,

Ferreira
M.A.R.

,

Bender
D.

,

Maller
J.

,

Sklar
P.

,

De Bakker
P.I.W.

,

Daly
M.J.

et al.

PLINK: a tool set for whole-genome association and population-based linkage analyses

.

Am. J. Hum. Genet.
2007

;

81

:

559

575

.

Belmont
J.W.

,

Hardenbol
P.

,

Willis
T.D.

,

Yu
F.

,

Yang
H.

,

Ch’Ang
L.Y.

,

Huang
W.

,

Liu
B.

,

Shen
Y.

,

Tam
P.K.H.

et al. .

Het internationale HapMap project

.

Nature

.

2003

;

426

:

789

796

.

Akdemir
K.C.

,

Jain
A.K.

,

Allton
K.

,

Aronow
B.

,

Xu
X.

,

Cooney
A.J.

,

Li
W.

,

Barton
M.C.
Genome-wide profiling reveals stimulus-specific functions of p53 during differentiation and DNA damage of human embryonic stem cells

.

Nucleic Acids Res.
2014

;

42

:

205

223

.

Pruim
R.J.

,

Welch
R.P.

,

Sanna
S.

,

Teslovich
T.M.

,

Chines
P.S.

,

Gliedt
T.P.

,

Boehnke
M.

,

Abecasis
G.R.

,

Willer
C.J.

,

Frishman
D.
LocusZoom: regional visualization of genome-wide association scan results

.

Bioinformatica

.

2011

;

26

:

2336

2337

.

Twohig
J.P.

,

Cardus Figueras
A.

,

Andrews
R.

,

Wiede
F.

,

Cossins
B.C.

,

Derrac Soria
A.

,

Lewis
M.J.

,

Townsend
M.J.

,

Millrine
D.

,

Li
J.

et al.

Activatie van naïeve CD4 + T-cellen herstemt STAT1 signalering om unieke cytokine responsen te leveren in geheugen CD4 + T-cellen

.

Nat. Immunol.
2019

;

20

:

458

470

.

Schultheis
A.M.

,

Martelotto
L.G.

,

De Filippo
M.R.

,

Piscuglio
S.

,

Ng
C.K.Y.

,

Hussein
Y.R.

,

Reis-Filho
J.S.

,

Soslow
R.A.

,

Weigelt
B.
TP53 mutatiespectrum in endometrioïde en sereuze endometriumkankers

.

Int. J. Gynecol. Pathol.
2016

;

35

:

289

300

.

Cho
S.W.

,

Xu
J.

,

Sun
R.

,

Mumbach
M.R.

,

Carter
A.C.

,

Chen
Y.G.

,

Yost
K.E.

,

Kim
J.

,

He
J.

,

Nevins
S.A.

et al. .

Promoter van lncRNA gen PVT1 is een tumor-onderdrukkend DNA grenselement

.

Cell

.

2018

;

173

:

1398

1412

.

Forbes
S.A.

,

Beare
D.

,

Boutselakis
H.

,

Bamford
S.

,

Bindal
N.

,

Tate
J.

,

Cole
C.G.

,

Ward
S.

,

Dawson
E.

,

Ponting
L.

et al. .

COSMIC: somatische kankergenetica met hoge resolutie

.

Nucleic Acids Res.
2017

;

45

:

D777

D783

.

Wang
D.

,

Li
D.

,

Qin
G.

,

Zhang
W.

,

Ouyang
J.

,

Zhang
M.

,

Xie
L.
De structurele karakterisering van tumor fusie genen en eiwitten

.

Comput. Math. Methods Med.
2015

;

2015

:

doi:10.1155/2015/912742

.

Yun
C.H.

,

Mengwasser
K.E.

,

Toms
A. V.

,

Woo
M.S.

,

Greulich
H.

,

Wong
K.K.

,

Meyerson
M.

,

Eck
M.J.
De T790M mutatie in EGFR kinase veroorzaakt geneesmiddelenresistentie door verhoging van de affiniteit voor ATP

.

Proc. Natl. Acad. Sci. U.S.A.
2008

;

105

:

2070

2075

.

Gao
J.

,

Aksoy
B.A.

,

Dogrusoz
U.

,

Dresdner
G.

,

Gross
B.

,

Sumer
S.O.

,

Sun
Y.

,

Jacobsen
A.

,

Sinha
R.

,

Larsson
E.

et al.

Integratieve analyse van complexe kanker genomics en klinische profielen met behulp van de cBioPortal

.

Sci. Signal.
2013

;

6

:

pl1

.

Jiang
S.

,

Xie
Y.

,

He
Z.

,

Zhang
Y.

,

Zhao
Y.

,

Chen
L.

,

Zheng
Y.

,

Miao
Y.

,

Zuo
Z.

,

Ren
J.
m6ASNP: a tool for annotating genetic variants by m6A function

.

Gigascience

.

2018

;

7

:

giy035

.

Mateo
L.

,

Guitart-Pla
O.

,

Pons
C.

,

Duran-Frigola
M.

,

Mosca
R.

,

Aloy
P.
A PanorOmic view of personal cancer genomes

.

Nucleic Acids Res.
2017

;

45

:

W195

W200

.

Teng
X.

,

Chen
X.

,

Xue
H.

,

Tang
Y.

,

Zhang
P.

,

Kang
Q.

,

Hao
Y.

,

Chen
R.

,

Zhao
Y.

,

He
S.
NPInter v4.0: an integrated database of ncRNA interactions

.

Nucleic Acids Res.
2020

;

48

:

D160

D165

.

Auteursopmerkingen

De auteurs willen dat bekend wordt dat naar hun mening de eerste twee auteurs als gezamenlijke eerste auteurs moeten worden beschouwd.

© The Author(s) 2019. Gepubliceerd door Oxford University Press namens NAR Genomics and Bioinformatics.
Dit is een Open Access-artikel dat wordt verspreid onder de voorwaarden van de Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/), die niet-commercieel hergebruik, distributie en reproductie in elk medium toestaat, mits het oorspronkelijke werk correct wordt geciteerd. Voor commercieel hergebruik, gelieve contact op te nemen met [email protected]

Plaats een reactie