CellProfiler Analyst: software til udforskning og analyse af data til komplekse billedbaserede screeninger

Visning af data

Fire typer plot er udgangspunktet for udforskning af store, flerdimensionelle billedbaserede screeninger i CellProfiler Analyst (Figur 1). Det er vigtigt, at disse værktøjer er kompatible med omfanget af data, der typisk erhverves i billedbaserede skærmbilleder, som kan være hundredvis af funktioner for hver af hundredvis af millioner af celler. Histogrammer viser fordelingen af værdierne for en målt egenskab ved at gruppere billed- eller objektdata i jævnt fordelt bins på en lineær eller logaritmisk skala (figur 1a). Sådanne diagrammer kan f.eks. være nyttige til at undersøge prøvernes cellecyklusstatus (ved at plotte DNA-indholdet pr. celle) eller til at undersøge outliers med henblik på kvalitetskontrol (f.eks. ved at plotte celletællinger pr. billede). To målte egenskaber pr. billede eller objekt kan vises på samme diagram via et scatterplot (figur 1b), hvilket også er nyttigt til at identificere hits og til kvalitetskontrolformål. For eksempel kan forskeren let udelukke billeder uden fokus fra analyse baseret på målinger foretaget af CellProfilers modul “Measure Image Quality” (måling af billedkvalitet). Da datapunkter i scatterplots kan dække hinanden, er de typisk uegnede til individuelle celledata, hvor hundredvis af millioner af datapunkter undersøges for at identificere interessante subpopulationer. I disse tilfælde er et tæthedsplot mere hensigtsmæssigt (figur 1c). Hver pixel i plottet repræsenterer en histogram-“bin”, og pixelens farve repræsenterer antallet af datapunkter i bin’en. Disse plot er f.eks. nyttige til at fastsætte tærskelværdier for, hvornår de enkelte celler skal klassificeres som “positive” eller “negative” på grundlag af to egenskaber (f.eks. på grundlag af to intensitetsmålinger som i flowcytometri). For at undersøge mere end to målte træk ved hvert billede eller datapunkt anvendes et parallelt koordinatplot. Parallelle koordinatplots gør det muligt at analysere flere datadimensioner, idet hver målt egenskabs skalerede (0-1) værdier får en separat y-akse, og de enkelte datapunkter forbindes på tværs af disse flere akser (figur 1d).

Figur 1
figur1

Fire typer plot kan oprettes. Der vises fire typer plot, der oprettes af CellProfiler Analyst. (a) Et histogram af data pr. billede (det gennemsnitlige areal for alle celler i billedet). (b) Scatterplot af billeddata (X-akse = gennemsnitsareal for alle celler i billedet; Y-akse = gennemsnitsareal for alle kerner i billedet). En bestemt prøve og dens replikater er fremhævet som blå datapunkter, og de blå linjer angiver +/- to standardafvigelser fra middelværdien, selv om den venstre standardafvigelseslinje ikke er synlig, fordi dataene er ikke-Gaussianske. (c) Tæthedsplot af data for individuelle celler (X-akse = cellens areal; Y-akse = kernearealet. (d) Parallelt koordinatplot, hvor 6 træk er plottet, et på hver nummereret akse, som er angivet i tabellen under plottet. De fire udvalgte blå datapunkter i spredningsdiagrammet er også fremhævet i det parallelle koordinatplot som blå linjer. Af dette plot fremgår det, at disse fire datapunkter har et stort celle- og kerneareal (to koordinater længst til venstre), men et lavt celletal (koordinat længst til højre).

Hvert datapunkt i et plot kan repræsentere en individuel celle eller derimod middelværdien for populationen af celler i et billede. Data kan også grupperes efter egenskaber, som prøverne har til fælles (f.eks. kemisk navn eller dosis). Flere eksperimenter, der undersøger det samme sæt behandlingsbetingelser (f.eks. kemiske forbindelser eller RNA-interferensreagenser), kan grupperes sammen, hvilket letter analysen af replikater. For alle typer plot kan de data, der skal vises, filtreres, f.eks. for kun at plotte data fra et enkelt billede, fra en stikprøve af datapunkter med bestemte lige store intervaller eller data, der opfylder visse kriterier (specificeret i SQL “where”-klausuler som “CellCount > 100”).

Udforskning af relationer mellem data

Datapunkter, der er udvalgt og fremhævet i ét plot, fremhæves straks i alle andre åbne plots (en teknik, der ofte kaldes “børstning” ), således at en prøve eller et sæt prøver kan undersøges i sammenhæng med andre sæt prøver (figur 2). Dette gør det f.eks. muligt at sammenligne målinger fra prøver af interesse med alle prøverne i forsøget. Brushing hjælper brugeren til lettere at undersøge sammenhænge i dataene, især når dataene har et stort antal attributter eller elementer, når dataene spænder over flere eksperimenter (herunder f.eks. gentagelser), eller når det er naturligt at undersøge forskellige dele af dataene ved hjælp af forskellige visninger. Penselkonceptet er udvidet i CellProfiler Analyst til situationer, hvor flere eksperimenter undersøges samtidigt: Når et punkt svarende til et bestemt billede fremhæves, kan alle punkter svarende til den eksperimentelle behandlingstilstand fremhæves, selv om dataene stammer fra flere eksperimenter, der undersøges sammen. I spredningsdiagrammet i figur 1b er fire datapunkter f.eks. blå, fordi ét oprindeligt blev valgt, og brugeren anmodede om, at replikater for denne prøve blev fremhævet.

Figur 2
figure2

Sammenhænge mellem data kan undersøges. Datapunkter, der repræsenterer billeder med stort kerneareal (gennemsnit over cellerne i billedet) og høj DNA-intensitet (gennemsnit over cellerne i billedet), fremhæves med blå farve ved at strege over det i (a) viste spredningsdiagram. Umiddelbart vises de tilsvarende punkter blå i det andet åbne spredningsdiagram (b), hvilket gør det muligt at undersøge forholdet mellem alle de plottede træk. Desuden viser et histogram over DNA-indholdet (c) individuelle celledata fra de udvalgte billeddatapunkter (blå) i forhold til alle cellerne i forsøget (rød). I dette tilfælde har de udvalgte blå datapunkter faktisk en usædvanlig cellecyklusfordeling (færre 2N-celler i forhold til 4N-celler) sammenlignet med alle cellerne i forsøget. Endelig kan de prøvenavne (d, kolonnen “Hairpin” for dette særlige RNA-interferensforsøg), der svarer til de udvalgte blå datapunkter, vises i en tabel for at se, hvilke prøver der er til stede i de udvalgte punkter. De to første kolonner i tabellen viser andre oplysninger om disse datapunkter baseret på akserne i det spredningsdiagram, der er vist i (a). Kolonnerne “ImageNumber” og “well” giver yderligere oplysninger om de prøver, som forskeren undersøger.

Undersøgning af data

Interessante datapunkter eller sæt af datapunkter kan undersøges ved at bore ned i dataene på flere måder (figur 3). For plot, der viser datapunkter, som repræsenterer billedmålinger, kan et datapunkt eller et sæt af datapunkter vælges, og de originale billeder, der producerede datapunktet, kan vises (figur 3d). Dette kan afsløre artefakter i prøveforberedelsen eller billeddannelsen, f.eks. fluorescerende testforbindelser, aggregater eller overdrevent mange farvningsreagenser, fibre eller affald (figur 3g). Disse artefakter dækker ikke kun over de faktiske celler i billederne, men kan også forstyrre den korrekte identifikation og måling af de resterende celler i billedet. Af disse og andre grunde kan der også vises billeder med identifikationsomrids som følge af billedanalyse (hvis de foreligger) for udvalgte datapunkter (figur 3e) for at identificere, om identifikationen af cellerne er sket korrekt. Dette er en vigtig overvejelse, da ingen segmenteringsalgoritmer er fejlfri.

Figur 3
Figur3

Datapunkter kan undersøges. De datapunkter, der er fremhævet med blå farve i spredningsdiagrammet (a), repræsenterer gentagelser af en bestemt behandlingsbetingelse med et højt gennemsnitligt celleareal og kerneareal. For at undersøge cellecyklusfordelingen i disse prøver blev der tegnet et histogram for DNA-indhold baseret på individuelle celler inden for disse fire billeder (b). For et af de fire datapunkter viste forskeren en tabel med alle målinger i databasen (c), det rå billede (d) eller med overlejrede konturer (e). Hver farvning/kanal (rød, grøn, blå) kan slås til eller fra for at muliggøre en nærmere undersøgelse af forholdet mellem dem. Oplysninger fra et offentligt websted, der beskriver det gen, der er testet i en af prøverne, er blevet vist (f) ved at klikke på datapunktet. Outlier-datapunkter for visse målte egenskaber (f.eks. høj gennemsnitlig celleaktinintensitet, højt gennemsnitligt celleareal, høj segmenteringstærskel eller procentdel af pixels, der er mættede) kan indikere billeder med alvorlige artefakter (g), som bør udelukkes fra analysen. Disse billeder kan identificeres ved deres afvigende målinger og udelukkes fra yderligere analyse ved hjælp af gating (dvs. ved kun at vælge en delmængde af data, der skal plottes og analyseres yderligere).

Dertil kommer, at et datapunkt eller et sæt datapunkter kan vælges, og et plot af målingerne af de individuelle celler, der var til stede i disse billeder, kan vises som et separat underplot. Dette gør det f.eks. muligt at vise et histogram for DNA-indhold, der angiver cellepopulationens cellecyklusfordeling, for et bestemt billede eller et sæt af billeder af interesse (figur 2c og figur 3b). For at undersøge identiteten af interessante prøver kan der vises en simpel liste over de behandlingsbetingelser, der producerede et sæt datapunkter, for at få et overblik (figur 2d). For yderligere undersøgelser kan webbaserede oplysninger om hvert enkelt billedes behandlingsbetingelser lanceres i en ekstern webbrowser (figur 3f), hvis de webadresser, der er knyttet til hver prøve, er gemt i databasen. Alle tilgængelige målinger og andre oplysninger for en bestemt prøve kan vises i en simpel tabel og gemmes som en kommasepareret tekstfil til analyse i en anden softwarepakke (Figur 3c).

Gating af data for individuelle celler til at score komplekse fænotyper

Billedbaserede data er enormt værdifulde, idet der er flere enkeltcellemålinger til rådighed. Reaktioner fra individuelle celler på en behandling er normalt inhomogene på grund af variationer i cellecyklus eller forskelle i proteinniveauer på grund af hukommelse eller stokastisk støj . I mange tilfælde kan en enkelt målt egenskab (f.eks. den samlede intensitet af rødfarvning i kernen) bruges til at score individuelle celler, og den eneste udfordring er at identificere en passende tærskel for scoring af positive celler. Dette kan opnås i CellProfiler Analyst ved hjælp af histogrammer af individuelle celledata. For komplekse fænotyper kan der være behov for flere egenskaber ved hver celle for at opnå en effektiv scoring. I disse tilfælde kan et tæthedsplot, der viser individuelle celler (figur 4a), være nyttigt til at identificere interessante celleunderpopulationer ved at afgrænse et afsnit af plottet (ofte kaldet “gating”). Det kan testes ved hjælp af to funktioner, om porten indeholder de interessante celler: funktionen “Show Object Montage” for at se, hvordan de enkelte celler inden for porten ser ud (Figur 4b), og funktionen “Show Image” for at se, om celler inden for en bestemt prøve er passende markeret som værende inden for eller uden for porten (Figur 4c). Når den endelige, ønskede subpopulation af celler er gated, beregnes antallet af celler, der falder inden for denne subpopulation, for hvert billede med henblik på yderligere statistisk analyse (figur 4d). Som eksempel kan nævnes, at når DNA og fosforyleret serin 10 i histon H3 begge er farvet, gør en simpel gate med to funktioner i CellProfiler Analyst det muligt at score mitotiske subfaser i humane HT29-celler (figur 4e). Mange softwaresystemer udfører billedanalyse i farten under billedoptagelsen; i sådanne tilfælde skal der på forhånd vælges en tærskelværdi for en interessant funktion for at score skærmen. I modsætning hertil giver disse værktøjer i CellProfiler Analyst mulighed for at teste effektiviteten af scoring baseret på forskellige funktioner og forskellige målingstærskelværdier.

Figur 4
figur4

Celleunderpopulationer kan identificeres, undersøges og scorer. (a) På et tæthedsplot af data for individuelle celler (log-skala: X-akse = integreret intensitet af kerne-DNA; Y-akse = kerneareal), blev to populationer gated (hvide kasser), og et tilfældigt udvalg af celler inden for hver subpopulation er vist i montagerne til højre (b); alle gated celler, der er til stede i en bestemt prøve, kan også markeres (c). Prøverne kan scorer (d) for antallet af gated celler og det samlede antal celler i hver prøve, berigelsen af denne procentdel i forhold til den samlede procentdel af positive celler i hele forsøget (“berigelse”; f.eks. har det første billede i tabellen 19,311 gange flere celler i subpopulationen end typisk i forsøget som helhed), og venstre- og højrehalv log10 p-værdierne (et mål for den statistiske betydning af berigelsen, baseret på antallet af celler i prøven). (e) Gates for anafase/telofase og sen profase/metafase (data er plottet for alle humane HT29-celler i eksperimentet . X-akse = integreret nukleær intensitet af DNA, log-skala; Y-akse = gennemsnitlig nukleær intensitet af phospho-histone H3). Tilfældige celler, der falder inden for portene, er vist i midten af hvert 34 x 34 mm delbillede.

Hvis der er behov for mere end to egenskaber til at score en fænotype, kan der anvendes sekventielle porte på celledataene. Denne fremgangsmåde anvendes på følgende måde: (1) hele populationen af celler fra et eksperiment vises i et tæthedsplot, (2) der tegnes en gate omkring de datapunkter, der repræsenterer potentielle celler af interesse, (3) gate justeres for at inkludere næsten alle positive celler og udelukke så mange negative celler som muligt, (4) den resulterende gated subpopulation plottes i et nyt tæthedsplot med to nye målefunktioner som akser, (5) subpopulationen gate igen baseret på disse nye funktioner, og (6) procentdelen af hvert billeds celler, der falder inden for den endelige gate, beregnes.

Casestudie: Screening af mitotisk subfase

Motivation

Vi ønskede at teste CellProfiler Analysts evne til at plotte, udforske og filtrere individuelle celledata for at identificere subpopulationer, der er defineret ved flere morfologiske træk. Vi valgte at identificere Drosophila melanogaster Kc167-celler i telofase og metafase i cellecyklusen ved hjælp af kun en DNA-farve. Identifikation af prøver med forstyrret cellecyklusregulering er af klar betydning for normal cellebiologi såvel som for kræftundersøgelser. Regulatorer af cellecyklus er blevet søgt intensivt i årtier via traditionelle og high-throughput-screeninger for ændringer i den samlede cellecyklusfordeling eller for øget phospho-histone H3-farvning, en markør for celler i sen G2- og M-fase (f.eks. og referencer heri). Vi tænkte, at der kunne findes yderligere gener, som, når de forstyrres, giver et øget antal kerner i metafase- eller telofase-stadiet uden at påvirke det samlede mitotiske indeks (phospho-histone H3-farvning) eller cellecyklusfordelingen væsentligt. Selv om vi ikke var bekendt med nogen positive kontroller med en sådan fænotype, mistænkte vi sådanne gener for tidligere at være blevet overset, fordi vi bemærkede, at ikke alle metafasekerner af ukendte årsager farvede klart for phospho-histone H3 (figur 5a). Identificering af gener, hvis RNAi producerer celler, der ser ud til at være i bestemte subfaser af mitose, uanset samtidig farvning af phospho-histone H3, ville være et første skridt i retning af at forstå disse fænomener.

Figur 5
figur5

Drosophila cellemikroarrays. (a) Phospho-histone H3-farvning er ofte svag for metafasekerner (venstre og midten vs. højre). Skala bar = 5 μm. (b) Et cellearray, DNA-farvet og kontrastforstærket (5× linse). Skala = 5 mm. (c) Lille udsnit af (a), med cirkler, der angiver 4 pletter på arrayet. Skala = 100 μm. (d) Billede i høj opløsning (40× linse) fra et punkt på arrayet, farvet med Hoechst (blå, DNA) og phalloidin (grøn, actin). Skala bar = 5 μm.

Flere grupper har afprøvet automatiserede metoder til scoring af mitotiske subfaser ; disse undersøgelser blev udført ved hjælp af beregningsværktøjer, der var skræddersyet til det specifikke assay, og var ofte afhængige af flere cellulære farvestoffer. Maskinlæringsmetoder er blevet udforsket af vores egen gruppe og andre (og se Konklusioner), men vi ønskede også at udforske at give brugeren mulighed for manuelt at vælge et lille antal funktioner af kendt biologisk relevans, efterfulgt af sekventiel gating på disse funktioner. Dette ville give forskeren fuld kontrol over de funktioner, der anvendes i scoringen, og scoringen ville lettere kunne overføres fra et eksperiment til det næste, fordi der vælges et lille antal funktioner. Vi ønskede derfor at score mitotiske subfaser udelukkende ved hjælp af en DNA-farve ved hjælp af overvåget udvælgelse af målinger efterfulgt af sekventiel gating på disse målinger i forbindelse med en softwarepakke, der kan anvendes af en ikke-computerekspert.

Billedscoring ved sekventiel gating af individuelle celledata

Vi screenede gener ved hjælp af Drosophila RNA-interferens levende cellemikroarrays for at identificere gen “knockdowns”, der giver et uforholdsmæssigt stort antal celler i to underfaser af mitose: metafase og anafase/telofase (for enkelhedens skyld benævnt telofase). Vi skabte og analyserede 5 replikater af et Drosophila-array med 1120 dsRNA-spots på et enkelt objektglas (figur 5b), herunder tre replikatspots for hvert af 288 gener (hovedsagelig kinaser og fosfataser) plus 256 negative kontrolspots uden dsRNA. Nogle fænotyper produceret i disse Drosophila Kc167-celler (f.eks. celledød) er synlige ved lav opløsning (5× linse; Figur 5c), men for at identificere telofase- og metafasekerner indsamlede vi individuelle billeder med høj opløsning inden for hvert spot på hvert objektglas (40× linse; lille del af et billede vist i Figur 5d).

Vi begyndte med telofase-fænotypen. For at bestemme, hvilke målte cellulære egenskaber der ville være mest effektive til scoring, håndplukkede vi repræsentative telofase kerner og normale G2-fase kerner fra tilfældige screeningsbilleder og skabte billedmontager for disse to klasser (Figur 6a) ved hjælp af Adobe Photoshop. Vi brugte CellProfiler til at måle kernefunktioner i disse monteringsbilleder, eksporterede derefter resultaterne til Excel og valgte fem funktioner til brug for sekventiel gating baseret på en kombination af biologisk intuition plus den kvantitative evne af hver funktion til at skelne telofase fra normale kerner ved hjælp af enkle statistiske tests i Excel. De udvalgte funktioner omfattede DNA-indhold, intensitet, form og teksturfunktioner (yderligere datafil 1).

Figur 6
figur6

Skemaet afslørede RNA-interferensprøver beriget i kerner i telofase- og metafase-stadiet. (a) Sammensatte billeder af håndplukkede Drosophila Kc167-kerner, der blev målt for at vejlede udvælgelse af funktioner og give udgangspunktet for udvikling af gates. Andre kerner i kanterne af hvert delpanel i det sammensatte billede blev udelukket fra analysen. (b) Et tilfældigt udsnit af automatisk scorede kerner fra cellemikroarrays. Den scorede celle er i midten af hvert panel, medmindre cellen var nær kanten af billedet. Skalaer = 5 μm. (c) Gener, hvis dsRNA’er signifikant øger andelen af celler i telofase (første fire rækker) eller metafase (sidste række). Vi udelukkede et gen (CG3245), der oprindeligt blev scoret som et telofasehit, fordi en visuel undersøgelse viste, at et billede indeholdt affald, der forstyrrede en korrekt analyse. Bemærk, at CG8878 ikke bør betragtes som telofase-specifik (se teksten). Den fjerde kolonne viser fold-ændringen i procentdelen af celler med hvert DNA-indhold (2N, 4N eller 8N) og fold-ændringen i det samlede celletal i alt, med signifikante forskelle fra alle gener testet på arrayet markeret med en stjerne. Se afsnittet Materialer og metoder for nærmere oplysninger om denne billedbaserede analyse af cellecyklusfordelingen. Den femte kolonne angiver fold-berigelsen for procentdelen af celler, der var phospho-histone H3-positive, ved hjælp af den gennemsnitlige intensitet af farvningen i kernen, baseret på gennemsnittet af to gentagelser. Referencer citeret i den sidste kolonne: A , B , C , D , E , F , G .

Vi udviklede derefter interaktivt sekventielle gates ved hjælp af tæthedsplots af disse funktioner i CellProfiler Analyst (se afsnittet “Gating af individuelle celledata for at score komplekse fænotyper”). For at udføre denne opgave blev CellProfiler brugt til at behandle det fulde sæt screeningsbilleder og indlæse de resulterende data i en database (2.8 millioner celler × 396 funktioner / celle = 1.1 milliarder målinger i alt). Dette gjorde det muligt for os at vise alle individuelle celler i forsøget i et indledende tæthedsgrafikkort med to af vores udvalgte egenskaber som akser, dvs. DNA-indhold og kerneens størrelse (areal). Vi tegnede en indledende gate omkring 2N DNA-indholdstoppen og det lille kerneareal og forfinede empirisk gaten for telofaseceller ved at undersøge billeder af de gated kerner og justere gate’s grænser i overensstemmelse hermed. Mens automatiserede metoder helt sikkert kunne identificere en grænse baseret på et af forskeren leveret træningssæt, giver denne manuelle metode biologen mulighed for specifikt at vurdere mange celler i nærheden af de relevante grænser. Når den passende gate var valgt til det første tæthedsgrafikkort, blev delpopulationen overført til et nyt tæthedsgrafikkort med to nye træk anvendt som akser, og den næste gate blev oprettet, idet der igen blev fundet de optimale parametre til at skelne telofase-kerner fra alle andre kerner. Denne procedure blev gentaget for det femte og sidste udvalgte træk. Da den sidste gate var blevet raffineret, anvendte vi de sekventielle gates på et nyt sæt billeder og bekræftede, at deres scoring var effektiv (tabel 1 og figur 6b), idet det lykkedes at skelne telofase fra andre kerner. Ved oprettelsen af portene forsøgte vi at minimere den falsk positive rate, mens vi accepterede en højere falsk negativ rate (tabel 1). Vi ræsonnerede, at sande hits ville have nok positive resultater til at overvinde denne med vilje strenge udvælgelsesprocedure. På dette tidspunkt anvendte vi de sidste sekventielle gates på alle cellerne for at score hele screeningen for telofasefænotypen. Vi fandt ud af, at portene typisk skal justeres en smule mellem forskellige gentagelsesobjekter på grund af variabilitet mellem eksperimenterne (f.eks, farvningsintensitet), selv om normaliseringsmetoder fra eksperiment til eksperiment kan undersøges for at reducere denne effekt.

Tabel 1 Nøjagtighed af scoring af metafase- og telofasefænotypen

Vi udførte separat den samme procedure for metafasefænotypen (ved hjælp af fire karakteristika til at skelne metafasekerner fra alle andre kerner); en komplet liste over de 288 testede gener og deres scorer for telofase og metafase er vist i ekstra datafil 2.

Telofaseanalyse

Rangordning af prøver efter procentdelen af telofasekerner afslørede 4 genknockdowns med en signifikant stigning i telofasekerner (figur 6c, de første 4 rækker). To af generne, der validerer tilgangen, er PP2A-kompleksunderenheder, der tidligere er blevet associeret med mitose: den katalytiske PP2A-C-underenhed mts (CG7109/mikrotubulusstjerne) og en regulerende underenhed af PP2A-A-familien (CG17291/CG33297/CG13383, Bemærk: dicistronisk med CSN8). RNAi mod begge gener øgede procentdelen af celler, der var phospho-histone H3-positive (figur 6c, femte kolonne). Et tredje hit, Ck1α (Casein kinase 1α/CG2028), er også tidligere blevet forbundet med mitose (Figur 6c, sidste kolonne). Vi bemærkede, at dens knockdown ved RNAi producerede kerner, hvis kromatin syntes at være lidt mindre kondenseret end typiske telofasekerner (Figur 7), mens det stadig var mere kondenseret end interfasekerner. Procentdelen af celler, der var phospho-histone H3-positive, var normal (figur 6c, femte kolonne). Tilsammen tyder disse observationer på, at denne defekt opstår i telofase/anafase i den sene fase. Det fjerde hit var en forudsagt kinase uden funktionel annotation (CG8878). Visuel inspektion afslørede, at næsten alle kerner i disse prøver fremstod lysere og mere kompakte end kontroller, en subtil, men reproducerbar effekt (figur 7). Dette resulterede forståeligt nok i, at flere af 2N-kernerne blev talt som havende telofase-lignende morfologi. Vi fandt, at disse celler ikke var beriget for phospho-histone H3-positivitet (Figur 6c, femte kolonne); uden yderligere eksperimentering er det uklart, om dette er en ægte mitotisk fænotype i det sene stadie eller snarere en fænotype med kondenserede kerner.

Figur 7
Figur7

Usædvanlige fænotyper blev fundet for telofasehits CG2028 og CG8878. Øverst: CG2028 knockdown producerer mange telofase-lignende kerner, der ser mindre kondenserede ud end typiske telofase-kerner, men mere kondenserede end interfasekerner. Nederst: Næsten alle kerner fra CG8878-prøven er mere kondenserede end kontrolkerner. Se teksten for en diskussion af begge gener. Skala bar = 20 μm.

Metafaseanalyse

Interessant nok er det eneste metafasetræf i denne screen (figur 6c, sidste række) den B’/B56-underfamiliens regulerende underenhed af PP2A (CG5643/widerborst), som på tidspunktet for vores screen ikke var blevet knyttet til cellecyklusregulering. Procentdelen af celler, der var phospho-histone H3-positive, var ikke meget højere end normalt (figur 6c, femte kolonne). Vi bekræftede med øjnene den metafaseinducerende fænotype af widerborst knockdown i de oprindelige billeder og i separate eksperimenter med to andre dsRNA’er, herunder et, der ikke var overlappende med det oprindelige (Figur 8a). Widerborst er et essentielt gen, der er involveret i planar cellepolarisering og apoptose . Især er Widerborst i andre sammenhænge (cirkadisk urproteincyklus og udvikling af sanseorganer ) indirekte forbundet med B/PR55-underfamiliens medlem af tvillinger/aar, som selv er kendt for at være påkrævet for metafase til anafaseovergang . Vores arbejde bekræfter derfor, med ikke-overlappende dsRNA’er, en nyligt rapporteret cellecyklusregulerende rolle for widerborst og indikerer sammenlagt, at det er usandsynligt, at denne fænotype skyldes off-target-effekter .

Den nærmeste menneskelige homolog af widerborst er PPP2R5E, epsilon-isoformen af en underfamilie af PP2R5 (alias B’/PR61/B56) regulerende underenheder af PP2A-komplekset. Der er endnu ikke blevet knyttet nogen særlig funktion til PPP2R5E. Vi spekulerede på, om PPP2R5E kunne være en B’-regulerende underenhed, der modulerer den kendte rolle for PP2A i mitose, i betragtning af vores fund af dens homolog widerborst’s rolle i Drosophila. PPP2R5E knockdown øgede ikke mitotisk indeks signifikant i nylige RNA-interferensskærme for øget phospho-histone H3 . Men da vi scorede disse samme PPP2R5E-knockdown-billeder for metafasemorfologi i stedet for phospho-histone H3-niveauer, opdagede vi en metafase-arrest-fænotype for PPP2R5E-knockdown, bekræftet af to forskellige shRNA’er (Figur 8b), hvilket stemmer overens med den fænotype, der er set for widerborst i Drosophila. Om widerborst/PPP2R5E i sig selv er nødvendige for metafase-til-anafase-overgangen, eller om deres udtynding forårsager fænotypen ved specifikt at forstyrre stofiometrien af det relevante PP2A-kompleks, er endnu ikke fastlagt. Nylige fund, at PPP2R5E lokaliseres til centromerer, og at B’-underfamilien af regulerende underenheder er nødvendig for korrekt meiotisk søsterkromatid-separation i fissions- og knopgær understøtter ideen om, at denne familie af underenheder faktisk er vigtig for korrekt kromatindynamik under celledeling.

Figur 8
figur8

Den bredereborst RNA-interferens metafasearrest-fænotype er bekræftet i Drosophila og menneskelige celler. (a) En prøveudtagning af metafasekerner produceret af widerborst knockdown i Drosophila Kc167-celler (øverst). Skalaen = 5 μm. Kvantitativ bekræftelse af den øgede procentdel af metafasekerner, som scoret af to blinde observatører (nederst). Søjlerne er stjernemarkeret, hvis p < 0,05. Fejlstænger = SEM. Kontroller er nærliggende pletter uden dsRNA. (b) Prøveudtagning af metafasekerner produceret af PPP2R5E knockdown i humane HT29-celler (øverst). Skalaen = 10 μm. Kvantitativ bekræftelse (nederst). Søjlerne er stjernemarkeret, hvis p < 0,001. Fejlstænger = SEM. Infektionshastigheden er forholdet mellem antallet af celler med/uden puromycin, selektionsmidlet, og antallet af celler med/uden puromycin. Kontrol-shRNA’et er FLJ25006 (NMid = NM_144610).

Skriv en kommentar