CellProfiler Analyst: datan tutkimus- ja analyysiohjelmisto monimutkaisia kuvapohjaisia seuloja varten

Datan tarkastelu

Neljä erityyppistä piirtoaluetyyppiä ovat lähtökohtana laajojen, moniulotteisten kuvapohjaisten seulojen tutkimiselle CellProfiler Analystissa (kuva 1). Tärkeää on, että nämä työkalut ovat yhteensopivia kuvapohjaisissa seuloissa tyypillisesti hankitun datan mittakaavan kanssa, joka voi olla satoja ominaisuuksia kutakin satoja miljoonia soluja kohti. Histogrammit näyttävät yhden mitatun ominaisuuden arvojen jakauman ryhmittelemällä kuva- tai objektitiedot tasaisin välimatkoin lineaarisella tai logaritmisella asteikolla (kuva 1a). Tällaiset kuvaajat voivat olla hyödyllisiä esimerkiksi näytteiden solusyklin tilan tutkimisessa (kuvaamalla solukohtaista DNA-pitoisuutta) tai poikkeavien arvojen tutkimisessa laadunvalvontaa varten (esim. kuvaamalla kuvakohtaista solujen lukumäärää). Kaksi mitattua ominaisuutta kuvaa tai kohdetta kohti voidaan esittää samassa kaaviossa hajontakuvion avulla (kuva 1b), mikä on myös hyödyllistä osumien tunnistamisessa ja laadunvalvonnassa. Tutkija voi esimerkiksi helposti sulkea pois analyysistä epätarkkoja kuvia CellProfilerin ”Measure Image Quality” -moduulin tekemien mittausten perusteella. Koska hajontakuvioiden datapisteet voivat peittää toisiaan, ne eivät yleensä sovellu yksittäisten solujen dataan, jossa tutkitaan satoja miljoonia datapisteitä kiinnostavien alapopulaatioiden tunnistamiseksi. Näissä tapauksissa tiheysdiagrammi on sopivampi (kuva 1c). Kuvion jokainen pikseli edustaa histogrammin ”biniä”, ja pikselin väri edustaa binissä olevien datapisteiden lukumäärää. Nämä kuvaajat ovat hyödyllisiä esimerkiksi määritettäessä kynnysarvoja, joilla yksittäiset solut voidaan luokitella ”positiivisiksi” tai ”negatiivisiksi” kahden ominaisuuden perusteella (esim. kahden intensiteettimittauksen perusteella, kuten virtaussytometriassa). Kunkin kuvan tai datapisteen useampien kuin kahden mitatun ominaisuuden tutkimiseen käytetään rinnakkaiskoordinaatistoa. Rinnakkaiskoordinaattikuvioiden avulla voidaan analysoida useiden dataulottuvuuksien tietoja, jolloin kunkin mitatun ominaisuuden skaalatuille (0-1) arvoille annetaan erillinen y-akseli ja yksittäiset datapisteet yhdistetään näiden useiden akselien välille (kuva 1d).

Kuvio 1
kuvio1

Neljä erityyppistä kuviotyyppiä voidaan luoda. Näytetään neljä CellProfiler Analyst -ohjelmalla luotua kuvaajatyyppiä. (a) Kuvakohtaisten tietojen histogrammi (kuvan kaikkien solujen keskimääräinen pinta-ala). (b) Kuvatietojen hajontadiagrammi (X-akseli = kuvan kaikkien solujen keskimääräinen pinta-ala; Y-akseli = kuvan kaikkien ytimien keskimääräinen pinta-ala). Yksi tietty näyte ja sen replikaatit on korostettu sinisinä datapisteinä, ja siniset viivat osoittavat +/- kaksi keskihajontaa keskiarvosta, vaikkakin vasen keskihajontaviiva ei näy, koska data ei ole gaussilaista. (c) Yksittäisten solujen tietojen tiheysdiagrammi (X-akseli = solun pinta-ala; Y-akseli = ytimen pinta-ala. (d) Rinnakkaiskoordinaatisto, johon on piirretty 6 piirrettä, yksi kullakin numeroidulla akselilla, jotka on merkitty kuvaajan alla olevassa taulukossa. Hajontakuvion neljä valittua sinistä datapistettä on myös korostettu rinnakkaiskoordinaatistossa sinisinä viivoina. Tästä kuvaajasta käy ilmi, että näissä neljässä datapisteessä on suuri solu- ja ydinpinta-ala (kaksi vasemmanpuoleisinta koordinaattia), mutta pieni solumäärä (oikeanpuoleisin koordinaatti).

Jokainen datapiste kuvaajassa voi edustaa yksittäistä solua tai, päinvastoin, kuvan solupopulaation keskiarvoa. Tiedot voidaan myös ryhmitellä näytteiden yhteisten ominaisuuksien mukaan (esim. kemiallinen nimi tai annos). Useita kokeita, joissa tutkitaan samoja käsittelyolosuhteita (esim. kemiallisia yhdisteitä tai RNA-interferenssireagensseja), voidaan ryhmitellä yhteen, mikä helpottaa toistojen analysointia. Kaikentyyppisten piirrosten osalta näytettävät tiedot voidaan suodattaa, esimerkiksi piirtää tietoja vain yhdestä kuvasta, tietopisteiden otoksesta tietyin yhtä suurin väliajoin tai tietoja, jotka täyttävät tietyt kriteerit (määritetty SQL:n ”where”-lausekkeilla, kuten ”CellCount > 100”).

Datan välisten suhteiden tutkiminen

Tietopisteet, jotka on valittu ja korostettu yhdessä kuvaajassa, korostetaan välittömästi kaikissa muissa avoimissa kuvaajissa (tekniikkaa kutsutaan usein ”harjaukseksi” ) siten, että näytettä tai näytejoukkoa voidaan tarkastella muiden näytejoukkojen yhteydessä (kuva 2). Tämä mahdollistaa esimerkiksi kiinnostavien näytteiden mittausten ja kaikkien kokeen näytteiden mittausten vertailun. Harjaus auttaa käyttäjää tarkastelemaan helpommin datan suhteita erityisesti silloin, kun datassa on suuri määrä attribuutteja tai kohteita, kun data kattaa useita kokeita (mukaan lukien esimerkiksi toistoja) tai kun on luonnollista tarkastella datan eri osia eri näkymien avulla. Harjauskonseptia on laajennettu CellProfiler Analystissa tilanteisiin, joissa tutkitaan samanaikaisesti useita kokeita: kun tiettyä kuvaa vastaava piste korostetaan, kaikki kyseistä kokeellista käsittelyehtoa vastaavat pisteet voidaan korostaa, vaikka tiedot olisivat peräisin useista kokeista, joita tutkitaan yhdessä. Esimerkiksi kuvan 1b sirontakuvassa neljä datapistettä on sinistä, koska alun perin valittiin yksi ja käyttäjä pyysi, että kyseisen näytteen replikaatit korostetaan.

Kuvio 2
kuvio2

Datan välisiä suhteita voidaan tutkia. Datapisteet, jotka edustavat kuvia, joissa on suuri ydinpinta-ala (kuvassa olevien solujen keskiarvo) ja suuri DNA-intensiteetti (kuvassa olevien solujen keskiarvo), on korostettu sinisellä sivelemällä (a) esitettyä scatterplotia. Vastaavat pisteet näkyvät välittömästi sinisinä toisessa avoimessa scatterplotissa (b), jolloin kaikkien piirrettyjen ominaisuuksien välistä suhdetta voidaan tarkastella. Myös DNA-pitoisuushistogrammi (c) näyttää yksittäisten solujen tiedot valituista kuvan datapisteistä (sininen) suhteessa kaikkiin kokeen soluihin (punainen). Tässä tapauksessa valituissa sinisissä datapisteissä on todellakin epätavallinen solusyklijakauma (vähemmän 2N-soluja suhteessa 4N-soluihin) verrattuna kaikkiin kokeen soluihin. Lopuksi valittuja sinisiä datapisteitä vastaavat näytteiden nimet (d, ”Hairpin”-sarake, tässä nimenomaisessa RNA-interferenssikokeessa) voidaan näyttää taulukossa, jotta nähdään, mitä näytteitä valituissa pisteissä on. Taulukon kahdessa ensimmäisessä sarakkeessa on muita tietoja kyseisistä datapisteistä, jotka perustuvat a) kohdassa esitetyn hajontakuvion akseleihin. ”ImageNumber”- ja ”well”-sarakkeet antavat lisätietoja näytteistä, joita tutkija tutkii.

Aineiston tutkiminen

Interventoivia datapisteitä tai datapistejoukkoja voidaan tutkia porautumalla aineistoon usealla eri tavalla (kuva 3). Kuvamittauksia edustavia datapisteitä sisältävistä kaavioista voidaan valita datapiste tai datapistejoukko ja näyttää datapisteen tuottaneet alkuperäiset kuvat (kuva 3d). Tämä voi paljastaa näytteen valmistuksessa tai kuvantamisessa esiintyviä artefakteja, kuten fluoresoivia testiyhdisteitä, aggregaatteja tai värjäysreagenssien, kuitujen tai roskien ylitarjontaa (kuva 3g). Nämä artefaktit eivät ainoastaan peitä kuvissa todellisia soluja, vaan ne voivat myös häiritä kuvassa jäljellä olevien solujen asianmukaista tunnistamista ja mittaamista. Näistä ja muista syistä voidaan myös näyttää kuvia, joissa näkyy kuva-analyysin tuloksena syntyneet tunnistuksen ääriviivat (jos saatavilla) valituista datapisteistä (kuva 3e), jotta voidaan tunnistaa, onko solujen tunnistaminen tapahtunut oikein. Tämä on tärkeä näkökohta, kun otetaan huomioon, että yksikään segmentointialgoritmi ei ole virheetön.

Kuva 3
kuva3

Datapisteitä voidaan tutkia. Sirontakuvassa (a) sinisellä korostetut datapisteet edustavat tietyn käsittelyolosuhteen toistoja, joissa keskimääräinen solupinta-ala ja ydinpinta-ala on suuri. Näiden näytteiden solusyklijakauman tutkimiseksi piirrettiin DNA-pitoisuushistogrammi, joka perustuu yksittäisiin soluihin näissä neljässä kuvassa (b). Yhdestä neljästä datapisteestä tutkija näytti taulukon kaikista tietokannan mittauksista (c), raakakuvan (d) tai ääriviivat päällekkäin (e). Kukin värjäys/kanava (punainen, vihreä, sininen) voidaan kytkeä päälle tai pois päältä, jotta niiden välisiä suhteita voidaan tarkastella tarkasti. Yhdessä näytteessä testattua geeniä kuvaavat tiedot julkiselta verkkosivustolta on näytetty (f) napsauttamalla datapistettä. Tiettyjen mitattujen ominaisuuksien poikkeavat datapisteet (esim. korkea solujen keskimääräinen aktiini-intensiteetti, korkea solujen keskimääräinen pinta-ala, korkea segmentointikynnys tai kyllästyneiden pikseleiden prosenttiosuus) voivat viitata kuviin, joissa on vakavia artefakteja (g), jotka olisi jätettävä analyysin ulkopuolelle. Nämä kuvat voidaan tunnistaa poikkeavien mittausten perusteella ja jättää jatkoanalyysin ulkopuolelle gating-toiminnolla (eli valitsemalla vain osajoukko datasta piirrettäväksi ja analysoitavaksi edelleen).

Lisäksi voidaan valita datapiste tai datapistejoukko, ja näissä kuvissa esiintyneiden yksittäisten solujen mittaustulosten piirros voidaan näyttää erillisenä subplotina. Näin voidaan esimerkiksi näyttää solupopulaation solusyklijakaumaa osoittava DNA-pitoisuushistogrammi tietystä kiinnostavasta kuvasta tai kuvajoukosta (kuva 2c ja kuva 3b). Kiinnostavien näytteiden identiteetin tutkimiseksi voidaan yleiskuvan saamiseksi näyttää yksinkertainen luettelo käsittelyolosuhteista, jotka tuottivat joukon datapisteitä (kuva 2d). Jatkotutkimusta varten kunkin kuvan käsittelyolosuhteita koskevat verkkopohjaiset tiedot voidaan käynnistää ulkoisessa verkkoselaimessa (kuva 3f), jos tietokantaan on tallennettu kuhunkin näytteeseen liittyvät verkko-osoitteet. Kaikki käytettävissä olevat mittaukset ja muut tiedot tietystä näytteestä voidaan näyttää yksinkertaisessa taulukossa ja tallentaa pilkulla erotettuna tekstitiedostona analysoitavaksi toisessa ohjelmistopaketissa (kuva 3c).

Yksittäisten solujen tietojen luokittelu monimutkaisten fenotyyppien pisteyttämiseksi

Kuviin perustuvat tiedot ovat valtavan arvokkaita siinä mielessä, että käytettävissä on useita yksittäisten solujen mittauksia. Yksittäisten solujen vasteet hoitoon ovat yleensä epähomogeenisia, koska solusyklin vaihtelut tai proteiinitasojen erot johtuvat muistista tai stokastisesta kohinasta . Monissa tapauksissa yksittäistä mitattua ominaisuutta (esim. punaisen värjäyksen kokonaisintensiteettiä tuman sisällä) voidaan käyttää yksittäisten solujen pisteyttämiseen, ja ainoa haaste on löytää sopiva kynnysarvo positiivisten solujen pisteyttämiselle. Tämä voidaan tehdä CellProfiler Analystissa käyttämällä yksittäisten solujen tietojen histogrammeja. Monimutkaisten fenotyyppien osalta tehokkaaseen pisteytykseen saatetaan tarvita useita ominaisuuksia kustakin solusta. Näissä tapauksissa yksittäisiä soluja kuvaava tiheysdiagrammi (kuva 4a) voi olla hyödyllinen mielenkiintoisten solujen alipopulaatioiden tunnistamiseksi rajaamalla diagrammin osa (jota usein kutsutaan ”gatingiksi”). Se, sisältääkö portti kiinnostavat solut, voidaan testata käyttämällä kahta ominaisuutta: ”Show Object Montage” -ominaisuudella voidaan nähdä, miltä yksittäiset solut portin sisällä näyttävät (kuva 4b), ja ”Show Image” -ominaisuudella voidaan nähdä, ovatko tietyn näytteen sisällä olevat solut asianmukaisesti merkitty portin sisä- vai ulkopuolelle (kuva 4c). Kun lopullinen, haluttu solujen osapopulaatio on rajattu, kyseiseen osapopulaatioon kuuluvien solujen määrä lasketaan jokaisesta kuvasta tilastollista jatkoanalyysia varten (kuva 4d). Kun esimerkiksi DNA ja histoni H3:n fosforyloitu seriini 10 ovat molemmat värjäytyneet, CellProfiler Analystin yksinkertainen kahden ominaisuuden portti mahdollistaa mitoottisten alavaiheiden pisteyttämisen ihmisen HT29-soluissa (kuva 4e). Monet ohjelmistojärjestelmät suorittavat kuva-analyysin lennossa kuvien ottamisen aikana; tällaisissa tapauksissa kiinnostavan ominaisuuden kynnysarvo on valittava etukäteen näytön pisteyttämistä varten. Sen sijaan CellProfiler Analystin työkalut mahdollistavat eri ominaisuuksiin ja erilaisiin mittauskynnysarvoihin perustuvan pisteytyksen tehokkuuden testaamisen.

Kuvio 4
kuvio4

Solujen alipopulaatioita voidaan yksilöidä, tutkia ja pisteyttää. (a) Yksittäisten solujen tietojen tiheysdiagrammilla (log-asteikko: X-akseli = ydin-DNA:n integroitu intensiteetti; Y-akseli = ydinpinta-ala), kaksi populaatiota gatattiin (valkoiset laatikot), ja satunnaisvalinta soluista kussakin osapopulaatiossa näkyy oikealla olevissa montageissa (b); kaikki tietyssä näytteessä olevat gatatut solut voidaan myös merkitä (c). Näytteet voidaan pisteyttää (d) kunkin näytteen gatattujen solujen ja kokonaissolujen lukumäärän, kyseisen prosenttiosuuden rikastumisen suhteessa positiivisten solujen kokonaisprosenttiosuuteen koko kokeessa (”Rikastuminen”; esimerkiksi taulukossa luetellussa ensimmäisessä kuvassa on 19,311-kertaisesti enemmän soluja alipopulaatiossa kuin tyypillisesti koko kokeessa) sekä vasemman- ja oikeanpuoleiset log10 p-arvot (rikastumisen tilastollisen merkitsevyyden mittari näytteessä olevien solujen lukumäärään perustuen). (e) Anafaasin/telopaasin ja myöhäisen profaasin/metafaasin portit (tiedot on piirretty kaikkien kokeessa olleiden ihmisen HT29-solujen osalta . X-akseli = DNA:n integroitu ydinvoimakkuus, log-asteikko; Y-akseli = fosfo-histoni H3:n keskimääräinen ydinvoimakkuus). Satunnaiset solut, jotka kuuluvat porttien sisään, näkyvät kunkin 34 x 34 mm:n alakuvan keskellä.

Jos fenotyypin pisteyttämiseen tarvitaan enemmän kuin kaksi piirrettä, soludatan päällä voidaan käyttää peräkkäisiä portteja. Tätä lähestymistapaa sovelletaan seuraavasti: (1) näytetään kokeen koko solupopulaatio tiheysdiagrammina, (2) piirretään portti niiden datapisteiden ympärille, jotka edustavat potentiaalisia kiinnostavia soluja, (3) säädetään portti siten, että se sisältää lähes kaikki positiiviset solut ja sulkee pois mahdollisimman monta negatiivista solua, (4) piirretään tuloksena saatu portoitu osapopulaatio uudessa tiheysdiagrammissa, jossa akseleina on kaksi uutta mittausominaisuutta, (5) portoidaan osapopulaatio uudelleen näiden uusien ominaisuuksien perusteella ja (6) lasketaan prosenttiosuus kunkin kuvan soluista, jotka kuuluvat lopullisen portin piiriin.

Tapaustutkimus: mitoottisen alavaiheen seulonta

Motivaatio

Haluimme testata CellProfiler Analystin kykyä piirtää, tutkia ja suodattaa yksittäisten solujen dataa useiden morfologisten ominaisuuksien perusteella määriteltyjen alapopulaatioiden tunnistamiseksi. Päätimme tunnistaa Drosophila melanogaster Kc167 -soluja solusyklin telofaasissa ja metafaasissa käyttäen vain DNA-värjäystä. Sellaisten näytteiden tunnistaminen, joissa solusyklin säätely on häiriintynyt, on selvästi tärkeää sekä normaalin solubiologian että syöpätutkimusten kannalta. Solusyklin säätelijöitä on vuosikymmenien ajan etsitty intensiivisesti perinteisillä ja korkean läpimenon seulonnoilla, joilla etsitään muutoksia solusyklin kokonaisjakaumassa tai lisääntynyttä fosfo-histoni H3 -värjäytymistä, joka on myöhäisessä G2- ja M-vaiheessa olevien solujen merkkiaine (esim. ja viittaukset niihin). Ajattelimme, että saattaisi olla olemassa muitakin geenejä, joita häiritsemällä metafaasi- tai telofaasivaiheen tumat lisääntyisivät ilman, että ne vaikuttaisivat merkittävästi mitoosi-indeksiin (fosfo-histoni H3 -värjäytyminen) tai solusyklin jakautumiseen. Vaikka emme olleet tietoisia mistään positiivisista kontrolleista, joilla olisi ollut tällainen fenotyyppi, epäilimme, että tällaiset geenit ovat saattaneet jäädä aiemmin huomiotta, koska huomasimme, että kaikki metafaasin tumat eivät tuntemattomista syistä värjäydy kirkkaasti fosfo-histoni H3:n suhteen (kuva 5a). Niiden geenien tunnistaminen, joiden RNAi tuottaa soluja, jotka näyttävät olevan tietyissä mitoosin alavaiheissa, riippumatta samanaikaisesta fosfo-histoni H3 -värjäytymisestä, olisi ensimmäinen askel kohti näiden ilmiöiden ymmärtämistä.

Kuvio 5
kuvio5

Drosophila-solujen mikrosarjat. (a) Fosfo-histoni H3 -värjäytyminen on usein himmeää metafaasiytimissä (vasemmalla ja keskellä vs. oikealla). Mittakaavapalkki = 5 μm. (b) Yksi solujoukko, DNA-värjätty ja kontrastivahvennettu (5 × linssi). Mittakaavapalkki = 5 mm. (c) Pieni poikkileikkaus kohdasta (a), jossa ympyrät merkitsevät 4 pistettä matriisissa. Mittakaavapalkki = 100 μm. (d) Korkearesoluutioinen kuva (40× linssi) matriisin pisteen sisältä, värjätty Hoechstillä (sininen, DNA) ja falloidiinilla (vihreä, aktiini). Mittakaavapalkki = 5 μm.

Monet ryhmät ovat testanneet automatisoituja menetelmiä mitoottisten subfaasien pisteyttämiseksi ; nämä tutkimukset toteutettiin tiettyyn määritykseen räätälöidyillä laskennallisilla työkaluilla, ja ne perustuivat usein useisiin soluvärjäyksiin. Ryhmämme ja muut ovat tutkineet koneoppimismenetelmiä (ks. Johtopäätökset), mutta halusimme myös tutkia mahdollisuutta antaa käyttäjälle mahdollisuus valita manuaalisesti pieni määrä tunnetusti biologisesti merkityksellisiä piirteitä, minkä jälkeen näitä piirteitä käytetään peräkkäin. Tämä antaisi tutkijalle täyden määräysvallan pisteytyksessä käytettäviin piirteisiin, ja pisteytys olisi helpommin siirrettävissä kokeesta toiseen, koska valitaan pieni määrä piirteitä. Tämän vuoksi halusimme pisteyttää mitoottiset alafaasit käyttämällä ainoastaan DNA-värjäystä ja käyttämällä mittausten valvottua valintaa, jota seuraa näiden mittausten peräkkäinen rajaus, sellaisen ohjelmistopaketin avulla, jota ei-tietotekniikan tutkija voi käyttää.

Kuvapisteytys yksittäisten solujen datan sekventiaalisen gatingin avulla

Screenasimme geenejä käyttämällä Drosophilan RNA-interferenssillä varustettuja elävien solujen mikrosarjoja yksilöidäksemme geenien ”knockdownit”, jotka tuottavat suhteettoman määrän soluja mitoosin kahdessa alavaiheessa: metafaasissa ja anafaasissa/telofaasissa (josta käytetään yksinkertaisuuden vuoksi nimitystä telopaasi). Loimme ja analysoimme 5 toistoa Drosophila-matriisista, jossa oli 1120 dsRNA-paikkaa yhdellä mikroskooppilevyllä (kuva 5b), mukaan lukien kolme toistoa kullekin 288 geenille (enimmäkseen kinaaseille ja fosfataaseille), sekä 256 negatiivista kontrollipaikkaa, joista puuttui dsRNA. Jotkin näissä Drosophila Kc167 -soluissa tuotetut fenotyypit (esim. solukuolema) näkyvät matalalla resoluutiolla (5× linssi; kuva 5c), mutta telopaasi- ja metafaasiytimien tunnistamiseksi keräsimme yksittäisiä korkearesoluutioisia kuvia jokaisen pisteen sisältä kullakin objektilasilla (40× linssi; pieni osa eräästä kuvasta on esitetty kuvassa 5d).

Aloitimme telopaasi-fenotyypistä. Määrittääksemme, mitkä mitatut soluominaisuudet olisivat tehokkaimpia pisteytystä varten, poimimme käsin satunnaisista seulontakuvista edustavia telopaasin ytimiä ja normaaleja G2-vaiheen ytimiä ja loimme kuvamontaaseja näille kahdelle luokalle (kuva 6a) Adobe Photoshopin avulla. Käytimme CellProfiler-ohjelmaa ydinpiirteiden mittaamiseen näissä montaasikuvissa, sitten veimme tulokset Exceliin ja valitsimme viisi piirrettä, joita käytimme peräkkäiseen luokitteluun biologisen intuition ja kunkin piirteen kvantitatiivisen kyvyn erottaa telofaasikuvat normaaleista ytimistä käyttäen yksinkertaisia tilastollisia testejä Excelissä. Valitut piirteet sisälsivät DNA-pitoisuuden, intensiteetin, muodon ja tekstuurin piirteet (lisätietotiedosto 1).

Kuvio 6
kuvio6

Seulonta paljasti, että RNA-interferenssinäytteet olivat rikastuneet telopaasi- ja metafaasivaiheen ytimiin. (a) Yhdistelmäkuvat käsin poimituista Drosophilan Kc167-ytimistä, jotka mitattiin ominaisuuksien valinnan ohjaamiseksi ja porttien kehittämisen lähtökohdaksi. Muut yhdistelmäkuvan kunkin alaruudun reunoilla olevat ytimet jätettiin analyysin ulkopuolelle. (b) Satunnaisotos automaattisesti pisteytetyistä ytimistä solumikroskoopista. Pisteytetty solu on kunkin paneelin keskellä, ellei solu ollut lähellä kuvan reunaa. Mittakaavapalkit = 5 μm. (c) Geenit, joiden dsRNA:t lisäävät merkittävästi telopaasissa (neljä ensimmäistä riviä) tai metafaasissa (viimeinen rivi) olevien solujen osuutta. Jätimme pois yhden geenin (CG3245), joka alun perin arvioitiin telophasihitiksi, koska silmämääräinen tarkastelu osoitti, että yksi kuva sisälsi roskia, jotka häiritsivät asianmukaista analyysia. Huomaa, että CG8878:aa ei pitäisi pitää telophasispesifisenä (ks. teksti). Neljännessä sarakkeessa esitetään kunkin DNA-pitoisuuden (2N, 4N tai 8N) sisältävien solujen prosenttiosuuden kertaistunut muutos ja solujen kokonaismäärän kertaistunut muutos, ja merkittävät erot kaikista testatuista geeneistä on merkitty tähdellä. Katso lisätietoja tästä kuvaan perustuvasta solusyklijakauman analyysistä kohdasta Materiaalit ja menetelmät. Viidennessä sarakkeessa ilmoitetaan fosfo-histoni H3-positiivisten solujen prosenttiosuuden moninkertainen rikastuminen käyttäen tuman värjäytymisen keskimääräistä intensiteettiä, joka perustuu kahden toistokerran keskiarvoon. Viimeisessä sarakkeessa mainitut viitteet: A , B , C , D , E , F , G .

Vuorovaikutteisesti kehitimme sitten peräkkäisiä portteja käyttäen näiden ominaisuuksien tiheysdiagrammeja CellProfiler Analyst -ohjelmassa (ks. jakso ”Yksittäisten solujen datan portitus monimutkaisten fenotyyppien pisteyttämiseksi”). Tätä tehtävää varten CellProfiler-ohjelmalla käsiteltiin kaikki seulontakuvat ja ladattiin tuloksena saadut tiedot tietokantaan (2,8 miljoonaa solua × 396 piirrettä/solu = yhteensä 1,1 miljardia mittausta). Näin voitiin näyttää kaikki kokeen yksittäiset solut alustavassa tiheysdiagrammissa, jonka akseleina oli kaksi valitsemaamme piirrettä, eli DNA-pitoisuus ja tuman koko (pinta-ala). Piirsimme alustavan portin 2N DNA-pitoisuushuipun ja pienen ytimen pinta-alan ympärille ja hienosäädimme porttia empiirisesti telofaasisolujen osalta tarkastelemalla kuvia portin kohteena olevista ytimistä ja säätämällä portin rajoja vastaavasti. Vaikka automatisoidut lähestymistavat voisivat varmasti tunnistaa rajan tutkijan toimittaman harjoitusjoukon perusteella, tämä manuaalinen lähestymistapa antaa biologille mahdollisuuden arvioida erityisesti monia soluja merkityksellisten rajojen läheisyydessä. Kun sopiva portti oli valittu alkuperäiseen tiheysdiagrammiin, osapopulaatio siirrettiin uuteen tiheysdiagrammiin, jossa käytettiin akseleina kahta uutta piirrettä, ja luotiin seuraava portti, jossa etsittiin jälleen optimaaliset parametrit, joilla telopaasin ytimet voitiin erottaa kaikista muista ytimistä. Tämä menettely toistettiin viidennen ja viimeisen valitun piirteen osalta. Kun viimeinen portti oli hiottu, sovelsimme peräkkäisiä portteja uuteen kuvasarjaan ja vahvistimme, että niiden pisteytys oli tehokasta (taulukko 1 ja kuva 6b) ja että ne erottivat onnistuneesti telofaasin muista ytimistä. Portteja luodessamme pyrimme minimoimaan väärien positiivisten kuvien osuuden ja hyväksymään samalla korkeamman väärien negatiivisten kuvien osuuden (taulukko 1). Ajattelimme, että oikeissa osumissa olisi riittävästi positiivisia tuloksia, jotta tämä tarkoituksellisen tiukka valintamenettely voitaisiin voittaa. Tässä vaiheessa sovelsimme lopullisia peräkkäisiä portteja kaikkiin soluihin, jotta koko seulonta saatiin pisteytettyä telophase-fenotyypin osalta. Havaitsimme, että portteja on tyypillisesti mukautettava hieman eri toistettujen diojen välillä kokeiden välisen vaihtelun vuoksi (esim, värjäytymisen voimakkuus), vaikka kokeiden välisiä normalisointimenetelmiä voitaisiin tutkia tämän vaikutuksen vähentämiseksi.

Taulukko 1 Metafaasi- ja telofaasi-fenotyypin pisteytyksen tarkkuus

Toteutimme erikseen saman menettelyn metafaasi-fenotyypille (käyttäen neljää piirrettä erottamaan metafaasiytimet kaikista muista ytimistä); täydellinen luettelo 288 testatusta geenistä ja niiden pisteytyksistä telofaasin ja metafaasin osalta on esitetty ylimääräisessä datatiedostossa 2.

Telophasianalyysi

Näytteiden järjestäminen telophasitumien prosenttiosuuden mukaan paljasti neljä geenin knockdown-geeniä, jotka lisäsivät merkittävästi telophasitumien määrää (kuva 6c, neljä ensimmäistä riviä). Lähestymistavan validoimiseksi kaksi näistä geeneistä on PP2A-kompleksin alayksiköitä, jotka on aiemmin yhdistetty mitoosiin: PP2A-C:n katalyyttinen alayksikkö mts (CG7109/microtubule star) ja PP2A-A-perheen säätelevä alayksikkö (CG17291/CG33297/CG13383, huom. dikistroninen CSN8:n kanssa). RNAi molempia geenejä vastaan lisäsi fosfo-histoni H3-positiivisten solujen prosenttiosuutta (kuva 6c, viides sarake). Kolmas osuma, Ck1α (kaseiinikinaasi 1α/CG2028), on myös aiemmin yhdistetty mitoosiin (kuva 6c, viimeinen sarake). Huomasimme, että sen tyrmääminen RNAi:llä tuotti tumia, joiden kromatiini näytti olevan hieman vähemmän kondensoitunutta kuin tyypillisten telopaasin tumien (kuva 7), mutta silti enemmän kondensoitunutta kuin interfaasin tumien. Fosfo-histoni H3-positiivisten solujen prosenttiosuus oli normaali (kuva 6c, viides sarake). Yhdessä nämä havainnot viittaavat siihen, että tämä vika esiintyy myöhäisessä vaiheessa telopaasia/anafaasia. Neljäs osuma oli ennustettu kinaasi, jolla ei ole toiminnallista merkintää (CG8878). Silmämääräinen tarkastelu osoitti, että lähes kaikki tumat näissä näytteissä näyttivät kirkkaammilta ja tiiviimmiltä kuin kontrolleissa, mikä on hienovarainen mutta toistettavissa oleva vaikutus (kuva 7). Tämä johti ymmärrettävästi siihen, että useammalla 2N-ytimellä katsottiin olevan telopaasin kaltainen morfologia. Huomasimme, että näissä soluissa ei ollut fosfo-histoni H3-positiivisuutta (kuva 6c, viides sarake); ilman lisäkokeita on epäselvää, onko kyseessä todellinen myöhäisvaiheen mitoottinen fenotyyppi vai pikemminkin tiivistyneiden ytimien fenotyyppi.

Kuvio 7
kuvio7

Epätavallisia fenotyyppejä havaittiin telofaasihittien CG2028 ja CG8878 osalta. Ylhäällä: CG2028:n knockdown tuottaa paljon telofaasin kaltaisia tumia, jotka näyttävät vähemmän tiivistetyiltä kuin tyypilliset telofaasin tumat mutta enemmän tiivistetyiltä kuin interfaasin tumat. Alhaalla: Lähes kaikki CG8878-näytteen ytimet ovat enemmän tiivistyneitä kuin kontrollit. Molempia geenejä koskeva keskustelu on esitetty tekstissä. Mittakaavapalkki = 20 μm.

Metafaasianalyysi

Interenkiintoista on, että ainoa metafaasihitti tässä seulonnassa (kuva 6c, viimeinen rivi) on PP2A:n B’/B56-alaperheen säätelyyn liittyvä B’/B56-alatyypin alayksikkö (CG5643/widerborst), jota seulontamme tehdessä sitä ei ollut yhdistetty solusyklin säätelyyn. Fosfo-histoni H3-positiivisten solujen prosenttiosuus ei ollut paljon normaalia suurempi (kuva 6c, viides sarake). Vahvistimme silmämääräisesti widerborstin knockdownin metafaasia indusoivan fenotyypin alkuperäisissä kuvissa ja erillisissä kokeissa kahdella muulla dsRNA:lla, mukaan lukien yksi, joka ei ollut päällekkäinen alkuperäisen kanssa (kuva 8a). Widerborst on olennainen geeni, joka osallistuu tasasolupolarisaatioon ja apoptoosiin . Huomionarvoista on, että muissa yhteyksissä (vuorokausikelloproteiinien kiertokulku ja aistielinten kehitys ) widerborst on epäsuorasti yhteydessä B/PR55-alaperheen jäseneen twins/aar, jonka puolestaan tiedetään olevan välttämätön metafaasista anafaasiin siirtymisessä . Työmme vahvistaa näin ollen ei-ylittävillä dsRNA:illa widerborstin hiljattain raportoidun solusyklin säätelytehtävän ja osoittaa yhdessä, että on epätodennäköistä, että tämä fenotyyppi johtuu off-target-vaikutuksista .

Werderborstin lähin ihmishomologi on PPP2R5E, PP2A-kompleksin PP2R5-alayksiköiden alaryhmän PP2R5-alayksiköiden (tunnetaan myös nimellä B’/PR61/B56) säätelevien alayksiköiden isomuoto PPP2R5E. PPP2R5E:hen ei ole toistaiseksi liitetty mitään erityistä toimintoa. Mietimme, voisiko PPP2R5E olla B’-säätelyalayksikkö, joka moduloi PP2A:n tunnettua roolia mitoosissa, kun otetaan huomioon, että löysimme sen homologin widerborstin roolin Drosofiassa. PPP2R5E:n knockdown ei lisännyt mitoosi-indeksiä merkittävästi hiljattain tehdyissä RNA-interferenssiseuloissa lisääntyneen fosfo-histoni H3:n osalta . Kun kuitenkin pisteytimme nämä samat PPP2R5E:n knockdown-kuvat metafaasimorfologian eikä fosfo-histoni H3-tasojen perusteella, havaitsimme PPP2R5E:n knockdownin metafaasipysähdysfenotyypin, joka vahvistettiin kahdella eri shRNA:lla (kuva 8b) ja joka on johdonmukainen widerborstin Drosophilassa havaitun fenotyypin kanssa. Jää vielä selvittämättä, tarvitaanko widerborstia/PPP2R5E:tä itsessään metafaasista anafaasiin siirtymiseen vai aiheuttaako niiden vähentäminen fenotyypin häiritsemällä erityisesti kyseisen PP2A-kompleksin stoikiometriaa. Viimeaikaiset havainnot siitä, että PPP2R5E lokalisoituu sentromeereihin ja että säätelyyn käytettävien alayksiköiden B’-alaryhmää tarvitaan moitteettomaan meioottiseen sisarkromatidien erottumiseen fissio- ja orastuvassa hiivassa, tukevat ajatusta siitä, että tämä alayksikköperhe on todellakin tärkeä moitteettomalle kromatiinin dynamiikalle solun jakautumisen aikana.

Kuvio 8
kuvio8

Werborstin RNA-interferenssin metafaasipysähdysfenotyyppi on vahvistettu Drosophilan ja ihmisen soluissa. (a) Näyte widerborstin knockdownin tuottamista metafaasiytimistä Drosophilan Kc167-soluissa (ylhäällä). Mittakaavapalkki = 5 μm. Kvantitatiivinen vahvistus metafaasiytimien lisääntyneestä prosenttiosuudesta kahden sokean tarkkailijan pisteyttämänä (alhaalla). Palkit on merkitty tähdellä, jos p < 0,05. Virhepalkit = SEM. Kontrollit ovat lähellä olevia täpliä, joista puuttuu dsRNA. (b) Näytteenotto metafaasiytimistä, jotka on tuotettu PPP2R5E:n knockdownilla ihmisen HT29-soluissa (ylhäällä). Mittakaavapalkki = 10 μm. Kvantitatiivinen vahvistus (alhaalla). Palkit on merkitty tähdellä, jos p < 0,001. Virhepalkit = SEM. Tartuntanopeus on solujen lukumäärän suhde valintamateriaalin, puromysiinin, kanssa / ilman puromysiiniä. Kontrolli-shRNA on FLJ25006 (NMid = NM_144610).

.

Jätä kommentti