Bookshelf

Wat is ascertainment bias, en hoe staat het in verband met de berekening van SNP-frequenties?

Ascertainment bias is een term in de populatiegenetica die systematische afwijkingen van een verwacht theoretisch resultaat beschrijft die toe te schrijven zijn aan de bemonsteringsprocessen die worden gebruikt om SNP’s te vinden (ascertainment) en hun populatiespecifieke allelfrequenties te meten (estimate).

De verdeling van SNP “afgeleide” allelfrequenties varieert in de natuur van 1/2N (d.w.z, één gemuteerd chromosoom in de hele genenpool van de soort), tot 2N-1/2N (d.w.z. dat er nog maar één chromosoom in de genenpool van de soort over is om de “voorouderlijke” alleltoestand te vertegenwoordigen; alle andere chromosomen hebben het afgeleide allel). Deze verdeling wordt echter onvolmaakt gemeten wanneer eindige substeekproeven uit de populatie worden getrokken. Hoe kleiner de eindige steekproef die in ons SNP-detectieproces (bemonstering) wordt gebruikt, hoe “onvolmaakter” de overeenkomst tussen de verdeling van afgeleide allelfrequenties en de “ware” verdeling in de natuur. Hier volgt een grafiek die de vertekening illustreert:

Image Content-Image003.jpg

Gewijzigd van Fig.2, Ref. (1).

Als SNP’s in dbSNP worden vastgesteld in monsters van een paar chromosomen, dan zal een fractie van die SNP’s buitensporig vaak in de populatie voorkomen ten opzichte van potentieel grotere monsters van dezelfde genoomsequentie.

Experimentele validatie betekent doorgaans dat de SNP wordt waargenomen in extra monsters die geen verband houden met de oorspronkelijke reeks chromosomen die zijn onderzocht om de SNP te definiëren. Daarom zullen veel voorkomende SNP’s met een hoger percentage “valideren” dan SNP’s met een echt zeldzaam klein allel, omdat er grotere monsters nodig zijn om de zeldzame variatie terug te vinden (en dus te bevestigen). Omdat alle steekproeven die worden gebruikt om SNP’s vast te stellen (te ontdekken) of hun allelfrequenties in specifieke bevolkingssteekproeven te schatten, een eindige omvang hebben, zal er in elke partij gegevens die bij dbSNP wordt ingediend, sprake zijn van enige vorm van vertekening door vaststellingen.

Plaats een reactie