Bookshelf

Mitä on ascertainment bias ja miten se liittyy SNP-taajuuksien laskemiseen?

Ascertainment bias on termi populaatiogenetiikassa, joka kuvaa systemaattisia poikkeamia odotetusta teoreettisesta tuloksesta, jotka johtuvat näytteenottoprosesseista, joita käytetään SNP:iden löytämiseen (ascertain) ja niiden populaatiokohtaisten alleelifrekvenssien mittaamiseen (estimointiin).

SNP:n ”johdetun” alleelifrekvenssin jakauma vaihtelee luonnossa 1/2N:stä (ts, yksi mutantti kromosomi koko lajin geenivarastossa), 2N-1/2N:ään (eli lajin geenivarastossa on jäljellä vain yksi kromosomi, joka edustaa ”esi-isien” alleelitilaa; kaikilla muilla kromosomeilla on johdettu alleeli). Tämä jakauma on kuitenkin epätäydellisesti mitattu, kun populaatiosta poimitaan rajallisia osanäytteitä. Mitä pienempää rajallista otosta käytetään SNP:n havaitsemisprosessissa (näytteenotossa), sitä ”epätäydellisempi” on johdettujen alleelien frekvenssien jakauman ja luonnossa vallitsevan ”todellisen” jakauman välinen yhteensopivuus. Tässä on kuvaaja, joka havainnollistaa harhaa:

Image Content-Image003.jpg

Muunnettu kuvasta 2, Ref. (1).

Jos dbSNP:ssä olevat SNP:t todetaan muutaman kromosomin näytteistä, osa näistä SNP:istä on populaatiossa liian yleisiä suhteessa mahdollisesti suurempiin näytteisiin samasta genomisekvenssistä.

Kokeellisella validoinnilla tarkoitetaan tyypillisesti SNP:n havainnoimista ylimääräisissä näytteissä, jotka eivät liity alkuperäiseen kromosomijoukkoon, joka tutkittiin SNP:n määrittämiseksi. Siksi yleiset SNP:t ”validoituvat” suuremmalla prosentilla kuin SNP:t, joissa on todella harvinainen pieni alleeli, koska tarvitaan suurempia näytteitä harvinaisen variaation takaisin saamiseksi (ja siten vahvistamiseksi). Koska kaikki näytteet, joita käytetään SNP:iden varmistamiseen (löytämiseen) tai niiden alleelifrekvenssien arvioimiseen tietyissä populaationäytteissä, ovat kooltaan rajallisia, jokaisessa dbSNP:hen toimitetussa tietoerässä on jonkinlaista varmistamisharhaa.

Jätä kommentti