CellProfiler Analyst: datan tutkimus- ja analyysiohjelmisto monimutkaisia kuvapohjaisia seuloja varten

Datan tarkastelu

Neljä erityyppistä piirtoaluetyyppiä ovat lähtökohtana laajojen, moniulotteisten kuvapohjaisten seulojen tutkimiselle CellProfiler Analystissa (kuva 1). Tärkeää on, että nämä työkalut ovat yhteensopivia kuvapohjaisissa seuloissa tyypillisesti hankitun datan mittakaavan kanssa, joka voi olla satoja ominaisuuksia kutakin satoja miljoonia soluja kohti. Histogrammit näyttävät yhden mitatun ominaisuuden arvojen jakauman ryhmittelemällä kuva- tai objektitiedot tasaisin välimatkoin lineaarisella tai logaritmisella asteikolla (kuva 1a). Tällaiset kuvaajat voivat olla hyödyllisiä esimerkiksi näytteiden solusyklin tilan tutkimisessa (kuvaamalla solukohtaista DNA-pitoisuutta) tai poikkeavien arvojen tutkimisessa laadunvalvontaa varten (esim. kuvaamalla kuvakohtaista solujen lukumäärää). Kaksi mitattua ominaisuutta kuvaa tai kohdetta kohti voidaan esittää samassa kaaviossa hajontakuvion avulla (kuva 1b), mikä on myös hyödyllistä osumien tunnistamisessa ja laadunvalvonnassa. Tutkija voi esimerkiksi helposti sulkea pois analyysistä epätarkkoja kuvia CellProfilerin ”Measure Image Quality” -moduulin tekemien mittausten perusteella. Koska hajontakuvioiden datapisteet voivat peittää toisiaan, ne eivät yleensä sovellu yksittäisten solujen dataan, jossa tutkitaan satoja miljoonia datapisteitä kiinnostavien alapopulaatioiden tunnistamiseksi. Näissä tapauksissa tiheysdiagrammi on sopivampi (kuva 1c). Kuvion jokainen pikseli edustaa histogrammin ”biniä”, ja pikselin väri edustaa binissä olevien datapisteiden lukumäärää. Nämä kuvaajat ovat hyödyllisiä esimerkiksi määritettäessä kynnysarvoja, joilla yksittäiset solut voidaan luokitella ”positiivisiksi” tai ”negatiivisiksi” kahden ominaisuuden perusteella (esim. kahden intensiteettimittauksen perusteella, kuten virtaussytometriassa). Kunkin kuvan tai datapisteen useampien kuin kahden mitatun ominaisuuden tutkimiseen käytetään rinnakkaiskoordinaatistoa. Rinnakkaiskoordinaattikuvioiden avulla voidaan analysoida useiden dataulottuvuuksien tietoja, jolloin kunkin mitatun ominaisuuden skaalatuille (0-1) arvoille annetaan erillinen y-akseli ja yksittäiset datapisteet yhdistetään näiden useiden akselien välille (kuva 1d).