CellProfiler Analyst: Datenexplorations- und -analysesoftware für komplexe bildbasierte Screens

Daten anzeigen

Vier Arten von Plots sind die Ausgangspunkte für die Untersuchung großer, multidimensionaler bildbasierter Screens in CellProfiler Analyst (Abbildung 1). Wichtig ist, dass diese Werkzeuge mit dem Umfang der Daten kompatibel sind, die typischerweise in bildbasierten Screens erfasst werden, d. h. Hunderte von Merkmalen für jede von Hunderten von Millionen von Zellen. Histogramme zeigen die Verteilung der Werte für ein gemessenes Merkmal an, indem Bild- oder Objektdaten in gleichmäßig beabstandete Bins auf einer linearen oder logarithmischen Skala gruppiert werden (Abbildung 1a). Solche Diagramme können z. B. hilfreich sein, um den Zellzyklusstatus von Proben zu untersuchen (durch Aufzeichnung des DNA-Gehalts pro Zelle) oder um Ausreißer für die Qualitätskontrolle zu untersuchen (z. B. durch Aufzeichnung der Zellzahlen pro Bild). Zwei gemessene Merkmale pro Bild oder Objekt können über ein Streudiagramm (Abbildung 1b) auf demselben Diagramm angezeigt werden, was ebenfalls zur Identifizierung von Treffern und für die Qualitätskontrolle nützlich ist. So kann der Forscher beispielsweise unscharfe Bilder auf der Grundlage der Messungen des CellProfiler-Moduls „Measure Image Quality“ problemlos von der Analyse ausschließen. Da sich die Datenpunkte in Streudiagrammen gegenseitig verdecken können, sind sie in der Regel ungeeignet für Einzelzelldaten, bei denen Hunderte von Millionen von Datenpunkten untersucht werden, um interessante Subpopulationen zu identifizieren. In diesen Fällen ist ein Dichteplot besser geeignet (Abbildung 1c). Jedes Pixel im Diagramm stellt ein Histogramm-„Bin“ dar, und die Farbe des Pixels gibt die Anzahl der Datenpunkte im Bin an. Diese Diagramme sind beispielsweise nützlich, um Schwellenwerte festzulegen, bei denen einzelne Zellen auf der Grundlage von zwei Merkmalen als „positiv“ oder „negativ“ klassifiziert werden (z. B. auf der Grundlage von zwei Intensitätsmessungen wie bei der Durchflusszytometrie). Um mehr als zwei gemessene Merkmale eines Bildes oder Datenpunktes zu untersuchen, wird ein paralleles Koordinatendiagramm verwendet. Parallele Koordinatendiagramme ermöglichen die Analyse mehrdimensionaler Daten, wobei die skalierten (0-1) Werte jedes gemessenen Merkmals eine eigene y-Achse erhalten und einzelne Datenpunkte über diese mehreren Achsen miteinander verbunden werden (Abbildung 1d).

Abbildung 1
Abbildung 1

Vier Arten von Diagrammen können erstellt werden. Es werden vier Arten von Diagrammen gezeigt, die von CellProfiler Analyst erstellt werden können. (a) Ein Histogramm der Daten pro Bild (die durchschnittliche Fläche aller Zellen im Bild). (b) Streudiagramm der Bilddaten (X-Achse = mittlere Fläche aller Zellen im Bild; Y-Achse = mittlere Fläche aller Zellkerne im Bild). Eine bestimmte Probe und ihre Wiederholungen sind als blaue Datenpunkte hervorgehoben, und die blauen Linien zeigen +/- zwei Standardabweichungen vom Mittelwert an, obwohl die linke Standardabweichungslinie nicht sichtbar ist, da die Daten nicht gaußförmig sind. (c) Dichteplot der Daten einzelner Zellen (X-Achse = Fläche der Zelle; Y-Achse = Fläche des Zellkerns. (d) Paralleles Koordinatendiagramm, in dem 6 Merkmale aufgetragen sind, eines auf jeder nummerierten Achse, wie in der Tabelle unter dem Diagramm angegeben. Die vier ausgewählten blauen Datenpunkte im Streudiagramm sind auch im parallelen Koordinatendiagramm als blaue Linien hervorgehoben. Aus dieser Darstellung ist ersichtlich, dass diese vier Datenpunkte eine große Zell- und Kernfläche (zwei Koordinaten ganz links), aber eine geringe Zellzahl (Koordinate ganz rechts) aufweisen.

Jeder Datenpunkt in einer Darstellung kann eine einzelne Zelle oder im Gegensatz dazu den Mittelwert der Zellpopulation innerhalb eines Bildes darstellen. Die Daten können auch nach Merkmalen gruppiert werden, die die Proben gemeinsam haben (z. B. chemischer Name oder Dosis). Mehrere Experimente, die dieselben Behandlungsbedingungen (z. B. chemische Verbindungen oder RNA-Interferenzreagenzien) untersuchen, können gruppiert werden, was die Analyse von Wiederholungen erleichtert. Bei allen Arten von Diagrammen können die anzuzeigenden Daten gefiltert werden, z. B. um nur Daten aus einem einzigen Bild, aus einer Stichprobe von Datenpunkten in bestimmten gleichen Abständen oder Daten, die bestimmte Kriterien erfüllen (angegeben in SQL-„where“-Klauseln wie „CellCount > 100“), darzustellen.

Untersuchung von Beziehungen zwischen Daten

Datenpunkte, die in einem Diagramm ausgewählt und hervorgehoben werden, werden sofort in allen anderen offenen Diagrammen hervorgehoben (eine Technik, die oft als „Brushing“ bezeichnet wird), so dass eine Stichprobe oder ein Satz von Stichproben im Zusammenhang mit anderen Sätzen von Stichproben untersucht werden kann (Abbildung 2). Dies ermöglicht zum Beispiel den Vergleich von Messungen von Proben, die von Interesse sind, mit allen Proben des Experiments. Brushing hilft dem Benutzer, Beziehungen in den Daten einfacher zu untersuchen, insbesondere wenn die Daten eine große Anzahl von Attributen oder Elementen enthalten, wenn die Daten mehrere Experimente umfassen (einschließlich z. B. Replikate) oder wenn es natürlich ist, verschiedene Teile der Daten mit verschiedenen Ansichten zu untersuchen. Das Brushing-Konzept wird in CellProfiler Analyst für Situationen erweitert, in denen mehrere Experimente gleichzeitig untersucht werden: Wenn ein Punkt, der einem bestimmten Bild entspricht, hervorgehoben wird, können alle Punkte, die dieser experimentellen Behandlungsbedingung entsprechen, hervorgehoben werden, selbst wenn die Daten aus mehreren Experimenten stammen, die zusammen untersucht werden. Im Streudiagramm in Abbildung 1b sind zum Beispiel vier Datenpunkte blau, weil ursprünglich einer ausgewählt wurde und der Benutzer verlangt hat, dass die Wiederholungen für diese Probe hervorgehoben werden.

Abbildung 2
Abbildung2

Beziehungen zwischen Daten können untersucht werden. Datenpunkte, die Bilder mit hoher Kernfläche (gemittelt über die Zellen im Bild) und hoher DNA-Intensität (gemittelt über die Zellen im Bild) darstellen, werden durch Streichen über das in (a) dargestellte Streudiagramm blau hervorgehoben. Unmittelbar danach erscheinen die entsprechenden Punkte im anderen offenen Streudiagramm (b) blau, so dass die Beziehung zwischen allen aufgezeichneten Merkmalen untersucht werden kann. Auch ein Histogramm des DNA-Gehalts (c) zeigt die Daten einzelner Zellen aus den ausgewählten Bilddatenpunkten (blau) im Verhältnis zu allen Zellen im Experiment (rot). In diesem Fall weisen die ausgewählten blauen Datenpunkte in der Tat eine ungewöhnliche Zellzyklusverteilung auf (weniger 2N-Zellen im Vergleich zu 4N-Zellen) im Vergleich zu allen Zellen im Experiment. Schließlich können die Probennamen (d, Spalte „Hairpin“, für dieses spezielle RNA-Interferenz-Experiment), die den ausgewählten blauen Datenpunkten entsprechen, in einer Tabelle angezeigt werden, um zu sehen, welche Proben in den ausgewählten Punkten vorhanden sind. Die ersten beiden Spalten der Tabelle zeigen weitere Informationen über diese Datenpunkte, die auf den Achsen des in (a) gezeigten Streudiagramms basieren. Die Spalten „ImageNumber“ und „well“ liefern zusätzliche Informationen über die Proben, die der Forscher untersucht.

Untersuchung von Daten

Interessante Datenpunkte oder Gruppen von Datenpunkten können untersucht werden, indem man die Daten auf verschiedene Weise aufschlüsselt (Abbildung 3). Bei Diagrammen mit Datenpunkten, die Bildmessungen darstellen, kann ein Datenpunkt oder ein Satz von Datenpunkten ausgewählt werden, und die Originalbilder, die den Datenpunkt erzeugt haben, können angezeigt werden (Abbildung 3d). Auf diese Weise können Artefakte bei der Probenvorbereitung oder der Bildgebung aufgedeckt werden, z. B. fluoreszierende Testverbindungen, Aggregate oder ein Übermaß an Färbereagenzien, Fasern oder Trümmern (Abbildung 3g). Diese Artefakte verdecken nicht nur die tatsächlichen Zellen auf den Bildern, sondern können auch die ordnungsgemäße Identifizierung und Messung der verbleibenden Zellen auf dem Bild beeinträchtigen. Aus diesen und anderen Gründen können für ausgewählte Datenpunkte auch Bilder mit Identifizierungsumrissen aus der Bildanalyse (falls verfügbar) angezeigt werden (Abbildung 3e), um zu erkennen, ob die Identifizierung der Zellen korrekt erfolgt ist. Dies ist eine wichtige Überlegung, da kein Segmentierungsalgorithmus fehlerfrei ist.

Abbildung 3
Abbildung3

Datenpunkte können untersucht werden. Die im Streudiagramm (a) blau hervorgehobenen Datenpunkte stellen Wiederholungen einer bestimmten Behandlungsbedingung mit hoher mittlerer Zellfläche und Kernfläche dar. Um die Zellzyklusverteilung dieser Proben zu untersuchen, wurde ein Histogramm des DNA-Gehalts auf der Grundlage der einzelnen Zellen in diesen vier Bildern erstellt (b). Für einen der vier Datenpunkte zeigte der Forscher eine Tabelle mit allen Messungen in der Datenbank (c), das Rohbild (d) oder mit überlagerten Umrissen (e) an. Jede Färbung/jeder Kanal (rot, grün, blau) kann ein- oder ausgeschaltet werden, um die Beziehungen zwischen ihnen genauer zu untersuchen. Informationen von einer öffentlichen Website, die das in einer der Proben getestete Gen beschreibt, werden durch Anklicken des Datenpunkts angezeigt (f). Ausreißerdatenpunkte für bestimmte gemessene Merkmale (z. B. hohe mittlere Zell-Aktin-Intensität, hohe mittlere Zellfläche, hohe Segmentierungsschwelle oder Prozentsatz der gesättigten Pixel) können auf Bilder mit schweren Artefakten hinweisen (g), die von der Analyse ausgeschlossen werden sollten. Diese Bilder können anhand ihrer abweichenden Messungen identifiziert und von der weiteren Analyse durch Gating ausgeschlossen werden (d. h. Auswahl nur einer Teilmenge von Daten, die aufgezeichnet und weiter analysiert werden sollen).

Zusätzlich kann ein Datenpunkt oder eine Gruppe von Datenpunkten ausgewählt und eine Darstellung der Messungen einzelner Zellen, die in diesen Bildern vorhanden waren, als separates Subplot angezeigt werden. Auf diese Weise kann z. B. ein Histogramm des DNA-Gehalts, das die Zellzyklusverteilung der Zellpopulation anzeigt, für ein bestimmtes Bild oder eine Reihe von Bildern von Interesse angezeigt werden (Abbildung 2c und Abbildung 3b). Um die Identität interessanter Proben zu untersuchen, kann eine einfache Liste der Behandlungsbedingungen angezeigt werden, die zu einer Reihe von Datenpunkten geführt haben, um einen Überblick zu erhalten (Abbildung 2d). Für weitere Untersuchungen können webbasierte Informationen über die Behandlungsbedingungen der einzelnen Bilder in einem externen Webbrowser aufgerufen werden (Abbildung 3f), wenn die mit den einzelnen Proben verbundenen Webadressen in der Datenbank gespeichert sind. Alle verfügbaren Messungen und andere Informationen für eine bestimmte Probe können in einer einfachen Tabelle angezeigt und als kommagetrennte Textdatei für die Analyse in einem anderen Softwarepaket gespeichert werden (Abbildung 3c).

Gating einzelner Zelldaten zur Bewertung komplexer Phänotypen

Bildbasierte Daten sind enorm wertvoll, da mehrere Einzelzellmessungen verfügbar sind. Die Reaktionen einzelner Zellen auf eine Behandlung sind in der Regel inhomogen, da der Zellzyklus variiert oder die Proteinspiegel aufgrund von Gedächtnisstörungen oder stochastischem Rauschen unterschiedlich sind. In vielen Fällen kann ein einziges gemessenes Merkmal (z. B. die Gesamtintensität der Rotfärbung im Zellkern) verwendet werden, um einzelne Zellen zu bewerten, und die einzige Herausforderung besteht darin, einen geeigneten Schwellenwert für die Bewertung positiver Zellen zu ermitteln. Dies kann in CellProfiler Analyst durch die Verwendung von Histogrammen einzelner Zelldaten erreicht werden. Bei komplexen Phänotypen können mehrere Merkmale jeder Zelle für eine effektive Bewertung erforderlich sein. In diesen Fällen kann ein Dichteplot, der einzelne Zellen zeigt (Abbildung 4a), nützlich sein, um interessante Zellsubpopulationen zu identifizieren, indem ein Abschnitt des Plots abgegrenzt wird (oft als „Gating“ bezeichnet). Ob das Gatter die interessierenden Zellen enthält, kann mit zwei Funktionen geprüft werden: mit der Funktion „Objektmontage anzeigen“, um zu sehen, wie einzelne Zellen innerhalb des Gatters aussehen (Abbildung 4b), und mit der Funktion „Bild anzeigen“, um zu sehen, ob Zellen innerhalb einer bestimmten Probe entsprechend als innerhalb oder außerhalb des Gatters markiert sind (Abbildung 4c). Sobald die endgültige, gewünschte Subpopulation von Zellen markiert ist, wird die Anzahl der Zellen, die in diese Subpopulation fallen, für jedes Bild berechnet, um weitere statistische Analysen durchzuführen (Abbildung 4d). Wenn beispielsweise sowohl die DNA als auch das phosphorylierte Serin 10 des Histons H3 angefärbt sind, ermöglicht ein einfaches Zwei-Merkmal-Gate in CellProfiler Analyst das Scoring mitotischer Subphasen in menschlichen HT29-Zellen (Abbildung 4e). Viele Softwaresysteme führen die Bildanalyse während der Bildaufnahme durch; in solchen Fällen muss ein Schwellenwert für ein Merkmal von Interesse im Voraus gewählt werden, um den Bildschirm zu bewerten. Im Gegensatz dazu ermöglichen diese Werkzeuge in CellProfiler Analyst das Testen der Wirksamkeit der Bewertung auf der Grundlage verschiedener Merkmale und verschiedener Messschwellenwerte.

Abbildung 4
Abbildung 4

Zellunterpopulationen können identifiziert, untersucht und bewertet werden. (a) Auf einem Dichteplot von Einzelzelldaten (logarithmische Skala: X-Achse = integrierte Intensität der Kern-DNA; Y-Achse = Kernfläche) wurden zwei Populationen gated (weiße Kästchen) und eine zufällige Auswahl von Zellen innerhalb jeder Subpopulation in den Montagen auf der rechten Seite gezeigt (b); alle gated Zellen in einer bestimmten Probe können auch markiert werden (c). Die Proben können bewertet werden (d) nach der Anzahl der gated Zellen und der Gesamtzellen in jeder Probe, der Anreicherung dieses Prozentsatzes im Verhältnis zum Gesamtprozentsatz positiver Zellen im gesamten Experiment („Anreicherung“; das erste in der Tabelle aufgeführte Bild hat beispielsweise 19,311-mal mehr Zellen in der Subpopulation als typisch für das Experiment insgesamt) und den log10 p-Werten am linken und rechten Ende (ein Maß für die statistische Signifikanz der Anreicherung, basierend auf der Anzahl der Zellen in der Probe). (e) Gates für Anaphase/Telophase und späte Prophase/Metaphase (die Daten sind für alle menschlichen HT29-Zellen im Experiment aufgetragen. X-Achse = integrierte Kernintensität der DNA, logarithmischer Maßstab; Y-Achse = mittlere Kernintensität von Phospho-Histon H3). Zufällige Zellen, die innerhalb der Gates liegen, sind in der Mitte jedes 34 x 34 mm großen Teilbildes dargestellt.

Wenn mehr als zwei Merkmale für die Bewertung eines Phänotyps erforderlich sind, können die Zelldaten mit sequenziellen Gates versehen werden. Dieser Ansatz wird wie folgt angewandt: (1) Darstellung der gesamten Zellpopulation eines Experiments in einem Dichteplot, (2) Zeichnen eines Gates um die Datenpunkte, die potenziell interessante Zellen darstellen, (3) Anpassen des Gates, um nahezu alle positiven Zellen einzuschließen und so viele negative Zellen wie möglich auszuschließen, (4) Darstellung der resultierenden Gated-Subpopulation in einem neuen Dichteplot mit zwei neuen Messmerkmalen als Achsen, (5) erneutes Gaten der Subpopulation auf der Grundlage dieser neuen Merkmale und (6) Berechnung des Prozentsatzes der Zellen jedes Bildes, die in das endgültige Gate fallen.

Fallstudie: Screening der mitotischen Subphase

Motivation

Wir wollten die Fähigkeit von CellProfiler Analyst testen, einzelne Zelldaten darzustellen, zu untersuchen und zu filtern, um Subpopulationen zu identifizieren, die durch mehrere morphologische Merkmale definiert sind. Wir entschieden uns für die Identifizierung von Drosophila melanogaster Kc167-Zellen in der Telophase und Metaphase des Zellzyklus, wobei wir nur eine DNA-Färbung verwendeten. Die Identifizierung von Proben mit gestörter Zellzyklusregulation ist sowohl für die normale Zellbiologie als auch für die Krebsforschung von großer Bedeutung. Seit Jahrzehnten wird intensiv nach Regulatoren des Zellzyklus gesucht, und zwar mit Hilfe von traditionellen und Hochdurchsatz-Screens auf Veränderungen in der Gesamtverteilung des Zellzyklus oder auf erhöhte Phospho-Histon-H3-Färbung, einem Marker für Zellen in der späten G2- und M-Phase (z. B. und Verweise darin). Wir vermuteten, dass es weitere Gene geben könnte, die, wenn sie gestört werden, zu einer erhöhten Anzahl von Kernen im Metaphasen- oder Telophasenstadium führen, ohne den gesamten Mitoseindex (Phospho-Histon H3-Färbung) oder die Zellzyklusverteilung wesentlich zu beeinflussen. Obwohl uns keine Positivkontrollen mit einem solchen Phänotyp bekannt waren, vermuteten wir, dass solche Gene zuvor übersehen worden sein könnten, da wir feststellten, dass nicht alle Metaphasenkerne aus unbekannten Gründen hell für Phospho-Histon H3 färben (Abbildung 5a). Die Identifizierung von Genen, deren RNAi Zellen erzeugt, die sich in bestimmten Subphasen der Mitose zu befinden scheinen, unabhängig von der gleichzeitigen Phospho-Histon-H3-Färbung, wäre ein erster Schritt zum Verständnis dieser Phänomene.

Abbildung 5
Abbildung5

Drosophila-Zell-Mikroarrays. (a) Die Phospho-Histon H3-Färbung ist bei Metaphasenkernen oft schwach ausgeprägt (links und Mitte vs. rechts). Maßstabsbalken = 5 μm. (b) Ein Zellarray, DNA-gefärbt und kontrastverstärkt (5× Objektiv). Maßstabsbalken = 5 mm. (c) Kleiner Ausschnitt von (a), mit Kreisen, die 4 Punkte auf dem Array bezeichnen. Maßstabsbalken = 100 μm. (d) Hochauflösendes Bild (40×-Objektiv) von einem Punkt des Arrays, gefärbt mit Hoechst (blau, DNA) und Phalloidin (grün, Aktin). Maßstabsbalken = 5 μm.

Verschiedene Gruppen haben automatisierte Methoden zur Bewertung mitotischer Subphasen getestet; diese Studien wurden mit Hilfe von Computertools durchgeführt, die auf den jeweiligen Test zugeschnitten waren und oft auf mehreren zellulären Färbungen beruhten. Methoden des maschinellen Lernens wurden von unserer Gruppe und anderen erforscht (siehe Schlussfolgerungen), aber wir wollten auch untersuchen, ob der Benutzer eine kleine Anzahl von Merkmalen mit bekannter biologischer Relevanz manuell auswählen kann, gefolgt von einer sequenziellen Auswertung dieser Merkmale. Auf diese Weise hätte der Forscher die volle Kontrolle über die für die Bewertung verwendeten Merkmale, und die Bewertung wäre leichter von einem Experiment zum nächsten übertragbar, da nur eine kleine Anzahl von Merkmalen ausgewählt wird. Wir wollten daher mitotische Subphasen nur mit Hilfe eines DNA-Farbstoffs bewerten, indem wir eine überwachte Auswahl von Messungen, gefolgt von einer sequenziellen Auswertung dieser Messungen, im Rahmen eines Softwarepakets verwendeten, das von einem Nicht-Informatiker genutzt werden kann.

Bildauswertung durch sequentielles Gating einzelner Zelldaten

Wir haben Gene mit Hilfe von Drosophila-RNA-Interferenz-Mikroarrays in lebenden Zellen untersucht, um Gen-„Knockdowns“ zu identifizieren, die zu einer unverhältnismäßig hohen Anzahl von Zellen in zwei Unterphasen der Mitose führen: Metaphase und Anaphase/Telophase (der Einfachheit halber als Telophase bezeichnet). Wir erstellten und analysierten 5 Wiederholungen eines Drosophila-Arrays mit 1120 dsRNA-Spots auf einem einzigen Objektträger (Abbildung 5b), darunter drei Wiederholungsspots für jedes von 288 Genen (hauptsächlich Kinasen und Phosphatasen) sowie 256 Negativkontrollspots ohne dsRNA. Einige Phänotypen, die in diesen Drosophila-Kc167-Zellen entstehen (z. B. Zelltod), sind bei niedriger Auflösung sichtbar (5×-Objektiv; Abbildung 5c), aber um Telophase- und Metaphase-Kerne zu identifizieren, sammelten wir einzelne hochauflösende Bilder innerhalb jedes Spots auf jedem Objektträger (40×-Objektiv; kleiner Ausschnitt eines Bildes in Abbildung 5d).

Wir begannen mit dem Telophase-Phänotyp. Um festzustellen, welche gemessenen zellulären Merkmale für die Bewertung am effektivsten wären, wählten wir repräsentative Telophase-Kerne und normale G2-Phasen-Kerne aus zufälligen Screening-Bildern aus und erstellten mit Adobe Photoshop Bildmontagen für diese beiden Klassen (Abbildung 6a). Wir verwendeten CellProfiler, um Kernmerkmale in diesen Bildmontagen zu messen, exportierten dann die Ergebnisse nach Excel und wählten fünf Merkmale für das sequenzielle Gating aus, basierend auf einer Kombination aus biologischer Intuition und der quantitativen Fähigkeit jedes Merkmals, Telophasen- von normalen Kernen zu unterscheiden, unter Verwendung einfacher statistischer Tests in Excel. Zu den ausgewählten Merkmalen gehörten DNA-Gehalt, Intensität, Form und Textur (zusätzliche Datendatei 1).

Abbildung 6
Abbildung6

Der Screen zeigte, dass RNA-Interferenz-Proben mit Kernen im Telophasen- und Metaphasen-Stadium angereichert waren. (a) Zusammengesetzte Bilder von handverlesenen Drosophila-Kc167-Kernen, die gemessen wurden, um die Merkmalsauswahl zu leiten und den Ausgangspunkt für die Entwicklung der Gates zu bilden. Andere Kerne an den Rändern jedes Teilbildes des zusammengesetzten Bildes wurden von der Analyse ausgeschlossen. (b) Eine Zufallsstichprobe von automatisch bewerteten Zellkernen aus den Zell-Mikroarrays. Die bewertete Zelle befindet sich in der Mitte jedes Feldes, es sei denn, die Zelle befand sich am Rand des Bildes. Skalenbalken = 5 μm. (c) Gene, deren dsRNAs den Anteil der Zellen in der Telophase (erste vier Reihen) oder Metaphase (letzte Reihe) signifikant erhöhen. Wir haben ein Gen (CG3245) ausgeschlossen, das ursprünglich als Telophasen-Treffer gewertet wurde, weil eine visuelle Prüfung ergab, dass ein Bild Trümmer enthielt, die eine ordnungsgemäße Analyse beeinträchtigten. Beachten Sie, dass CG8878 nicht als telophasenspezifisch angesehen werden sollte (siehe Text). Die vierte Spalte zeigt die Fold-Änderung des Prozentsatzes der Zellen mit dem jeweiligen DNA-Gehalt (2N, 4N oder 8N) und die Fold-Änderung der Gesamtzellzahl insgesamt, wobei signifikante Unterschiede von allen auf dem Array getesteten Genen mit einem Stern gekennzeichnet sind. Einzelheiten zu dieser bildbasierten Analyse der Zellzyklusverteilung finden Sie im Abschnitt Materialien und Methoden. Die fünfte Spalte zeigt die Faltenanreicherung für den Prozentsatz der Zellen, die Phospho-Histon H3-positiv waren, unter Verwendung der mittleren Intensität der Färbung im Zellkern, basierend auf dem Durchschnitt von zwei Wiederholungen. In der letzten Spalte angegebene Referenzen: A , B , C , D , E , F , G .

Anschließend entwickelten wir interaktiv sequentielle Gates unter Verwendung von Dichteplots dieser Merkmale in CellProfiler Analyst (siehe Abschnitt „Gating einzelner Zelldaten zur Bewertung komplexer Phänotypen“). Um diese Aufgabe zu erfüllen, wurde CellProfiler verwendet, um den gesamten Satz von Screening-Bildern zu verarbeiten und die resultierenden Daten in eine Datenbank zu laden (2,8 Millionen Zellen × 396 Merkmale/Zelle = 1,1 Milliarden Messungen insgesamt). Auf diese Weise konnten wir alle einzelnen Zellen des Experiments in einem anfänglichen Dichteplot mit zwei von uns ausgewählten Merkmalen als Achsen darstellen, d. h. DNA-Gehalt und Größe (Fläche) des Zellkerns. Wir zogen ein anfängliches Gatter um den Spitzenwert des 2N-DNA-Gehalts und die kleine Kernfläche und verfeinerten das Gatter empirisch für die Telophase-Zellen, indem wir die Bilder der Gatterkerne untersuchten und die Grenzen des Gatters entsprechend anpassten. Während automatisierte Ansätze sicherlich eine Grenze auf der Grundlage eines vom Forscher bereitgestellten Trainingssatzes identifizieren könnten, ermöglicht dieser manuelle Ansatz dem Biologen eine spezifische Bewertung vieler Zellen in der Nähe der relevanten Grenzen. Nach der Auswahl des geeigneten Gatters für den ersten Dichteplot wurde die Teilpopulation in einen neuen Dichteplot mit zwei neuen Merkmalen als Achsen übertragen, und das nächste Gatter wurde erstellt, wobei wiederum die optimalen Parameter zur Unterscheidung der Telophasenkerne von allen anderen Kernen gefunden wurden. Dieses Verfahren wurde für das fünfte und letzte ausgewählte Merkmal wiederholt. Nachdem das letzte Gatter verfeinert worden war, wendeten wir die sequentiellen Gatter auf einen neuen Satz von Bildern an und bestätigten, dass ihre Bewertung effektiv war (Tabelle 1 und Abbildung 6b) und die Telophase erfolgreich von anderen Kernen unterschied. Bei der Erstellung der Gates haben wir versucht, die Falsch-Positiv-Rate zu minimieren und gleichzeitig eine höhere Falsch-Negativ-Rate in Kauf zu nehmen (Tabelle 1). Wir gingen davon aus, dass echte Treffer genügend positive Ergebnisse haben würden, um dieses absichtlich strenge Auswahlverfahren zu überstehen. Zu diesem Zeitpunkt wendeten wir die endgültigen sequenziellen Gates auf alle Zellen an, um den gesamten Screen auf den Telophasenphänotyp zu überprüfen. Wir haben festgestellt, dass die Gates aufgrund der Variabilität zwischen den einzelnen Experimenten (z. B. Färbeintensität) in der Regel zwischen verschiedenen Replikat-Objektträgern leicht angepasst werden müssen, Färbeintensität), obwohl Methoden zur Normalisierung von Experiment zu Experiment erforscht werden könnten, um diesen Effekt zu verringern.

Tabelle 1 Genauigkeit der Bewertung des Metaphase- und Telophase-Phänotyps

Wir haben dasselbe Verfahren separat für den Metaphase-Phänotyp durchgeführt (unter Verwendung von vier Merkmalen, um Metaphase-Kerne von allen anderen Kernen zu unterscheiden); eine vollständige Liste der 288 getesteten Gene und ihrer Bewertungen für Telophase und Metaphase ist in der zusätzlichen Datendatei 2 enthalten.

Telophasenanalyse

Die Reihung der Proben nach dem Prozentsatz der Telophasenkerne ergab 4 Genknockdowns mit einer signifikanten Zunahme der Telophasenkerne (Abbildung 6c, erste 4 Zeilen). Zwei dieser Gene sind Untereinheiten des PP2A-Komplexes, die bereits früher mit der Mitose in Verbindung gebracht wurden: die katalytische Untereinheit mts des PP2A-C (CG7109/microtubule star) und eine regulatorische Untereinheit der PP2A-A-Familie (CG17291/CG33297/CG13383, Anmerkung: dicistronisch mit CSN8), was den Ansatz bestätigt. RNAi gegen beide Gene erhöhte den Anteil der Zellen, die Phospho-Histon H3-positiv waren (Abbildung 6c, fünfte Spalte). Ein dritter Treffer, Ck1α (Casein-Kinase 1α/CG2028), wurde zuvor ebenfalls mit der Mitose in Verbindung gebracht (Abbildung 6c, letzte Spalte). Wir stellten fest, dass seine Ausschaltung durch RNAi zu Kernen führte, deren Chromatin etwas weniger kondensiert erschien als das typischer Telophasenkerne (Abbildung 7), aber immer noch stärker kondensiert war als das von Interphasenkernen. Der Anteil der Zellen, die Phospho-Histon H3-positiv waren, war normal (Abbildung 6c, fünfte Spalte). Zusammengenommen deuten diese Beobachtungen darauf hin, dass dieser Defekt in der späten Telophase/Anaphase auftritt. Der vierte Treffer war eine vorhergesagte Kinase ohne funktionelle Annotation (CG8878). Die visuelle Inspektion ergab, dass fast alle Kerne in diesen Proben heller und kompakter erschienen als in den Kontrollen, ein subtiler, aber reproduzierbarer Effekt (Abbildung 7). Dies führte verständlicherweise dazu, dass mehr der 2N-Kerne mit telophasenähnlicher Morphologie gezählt wurden. Wir stellten fest, dass diese Zellen nicht mit Phospho-Histon H3-Positivität angereichert waren (Abbildung 6c, fünfte Spalte); ohne weitere Experimente ist unklar, ob es sich hierbei um einen echten Phänotyp im späten mitotischen Stadium oder eher um einen Phänotyp kondensierter Kerne handelt.

Abbildung 7
Abbildung7

Ungewöhnliche Phänotypen wurden für die Telophasen-Hits CG2028 und CG8878 gefunden. Oben: Der Knockdown von CG2028 erzeugt viele Telophasen-ähnliche Kerne, die weniger kondensiert erscheinen als typische Telophasenkerne, aber kondensierter als Interphasenkerne. Unten: Fast alle Kerne aus der CG8878-Probe sind stärker kondensiert als die der Kontrollgruppe. Erläuterungen zu beiden Genen siehe Text. Maßstabsbalken = 20 μm.

Metaphasenanalyse

Interessanterweise ist der einzige Metaphasentreffer in diesem Screening (Abbildung 6c, letzte Zeile) die regulatorische Untereinheit der B’/B56-Unterfamilie von PP2A (CG5643/widerborst), die zum Zeitpunkt unseres Screenings noch nicht mit der Zellzyklusregulation in Verbindung gebracht worden war. Der Prozentsatz der Zellen, die Phospho-Histon H3-positiv waren, war nicht viel höher als normal (Abbildung 6c, fünfte Spalte). Wir bestätigten den Metaphasen-induzierenden Phänotyp des Widerborst-Knockdowns mit dem Auge in den Originalbildern und in separaten Experimenten mit zwei anderen dsRNAs, darunter eine, die sich nicht mit dem Original überschnitt (Abbildung 8a). Widerborst ist ein essenzielles Gen, das an der planaren Zellpolarisierung und Apoptose beteiligt ist. Bemerkenswerterweise ist Widerborst in anderen Zusammenhängen (zirkadianer Uhrenprotein-Zyklus und Entwicklung der Sinnesorgane) indirekt mit dem Mitglied der B/PR55-Unterfamilie twins/aar verbunden, das seinerseits für den Übergang von der Metaphase zur Anaphase erforderlich ist. Unsere Arbeit bestätigt daher mit nicht überlappenden dsRNAs eine kürzlich gemeldete Rolle von widerborst bei der Zellzyklusregulierung und deutet darauf hin, dass es unwahrscheinlich ist, dass dieser Phänotyp auf Off-Target-Effekte zurückzuführen ist.

Das engste menschliche Homolog von widerborst ist PPP2R5E, die Epsilon-Isoform einer Unterfamilie von PP2R5 (auch bekannt als B’/PR61/B56) regulatorischen Untereinheiten des PP2A-Komplexes. Bisher wurde mit PPP2R5E keine besondere Funktion in Verbindung gebracht. Wir fragten uns, ob PPP2R5E eine B‘-regulatorische Untereinheit sein könnte, die die bekannte Rolle von PP2A in der Mitose moduliert, da wir die Rolle seines Homologs Widerborst in Drosophila kennen. Der Knockdown von PPP2R5E hat den Mitoseindex in den jüngsten RNA-Interferenz-Screens für erhöhtes Phospho-Histon H3 nicht signifikant erhöht. Als wir jedoch dieselben PPP2R5E-Knockdown-Bilder auf die Metaphasenmorphologie und nicht auf die Phospho-Histon-H3-Konzentration untersuchten, entdeckten wir einen Metaphasen-Arrest-Phänotyp für PPP2R5E-Knockdown, der durch zwei verschiedene shRNAs bestätigt wurde (Abbildung 8b) und mit dem Phänotyp übereinstimmt, der für Widerborst in Drosophila beobachtet wurde. Ob Widerborst/PPP2R5E selbst für den Übergang von der Metaphase zur Anaphase erforderlich sind oder ob ihre Deletion den Phänotyp durch eine spezifische Störung der Stöchiometrie des relevanten PP2A-Komplexes verursacht, muss noch geklärt werden. Jüngste Entdeckungen, dass PPP2R5E an Zentromeren lokalisiert ist und dass die B‘-Unterfamilie der regulatorischen Untereinheiten für eine ordnungsgemäße meiotische Schwesterchromatidentrennung in Spalt- und Knospenhefen erforderlich ist, unterstützen die Idee, dass diese Familie von Untereinheiten tatsächlich für eine ordnungsgemäße Chromatindynamik während der Zellteilung wichtig ist.

Abbildung 8
Abbildung8

Der Widerborst-RNA-Interferenz-Metaphasenarrest-Phänotyp wird in Drosophila- und menschlichen Zellen bestätigt. (a) Eine Auswahl von Metaphasenkernen, die durch Widerborst-Knockdown in Drosophila Kc167-Zellen erzeugt wurden (oben). Maßstabsbalken = 5 μm. Quantitative Bestätigung des erhöhten Prozentsatzes an Metaphasekernen, wie von zwei verblindeten Beobachtern bewertet (unten). Die Balken sind mit Sternen versehen, wenn p < 0,05. Fehlerbalken = SEM. Die Kontrollen sind nahe gelegene Spots ohne dsRNA. (b) Eine Stichprobe von Metaphase-Kernen, die durch PPP2R5E-Knockdown in menschlichen HT29-Zellen (oben) erzeugt wurden. Maßstabsbalken = 10 μm. Quantitative Bestätigung (unten). Die Balken sind mit Sternen versehen, wenn p < 0,001. Fehlerbalken = SEM. Die Infektionsrate ist das Verhältnis der Anzahl der Zellen mit/ohne Puromycin, dem Selektionsmittel. Die Kontroll-shRNA ist FLJ25006 (NMid = NM_144610).

Schreibe einen Kommentar