Bookshelf

Vad är bias och hur relaterar det till beräkningen av SNP-frekvenser?

Ascertainment bias är en term inom populationsgenetik som beskriver systematiska avvikelser från ett förväntat teoretiskt resultat som kan tillskrivas de provtagningsprocesser som används för att hitta (ascertain) SNP:er och mäta (estimera) deras populationsspecifika allelfrekvenser.

Fördelningen av SNP:s ”härledda” allelfrekvenser varierar i naturen från 1/2N (dvs, en muterad kromosom i hela artens genpool) till 2N-1/2N (dvs. endast en kromosom kvar i artens genpool för att representera det ”ursprungliga” alleltillståndet; alla andra kromosomer har den avledda allelen). Denna fördelning mäts dock ofullständigt när ändliga delprov tas från populationen. Ju mindre det ändliga urvalet är som används i vår process för SNP-detektering (provtagning), desto mer ”ofullkomlig” blir överensstämmelsen mellan fördelningen av härledda allelfrekvenser och den ”sanna” fördelningen i naturen. Här är ett diagram som illustrerar bias:

Image Content-Image003.jpg

Modifierad från Fig.2, Ref. (1).

Om SNP:er i dbSNP fastställs i prover av ett fåtal kromosomer kommer en del av dessa SNP:er att vara överdrivet vanliga i populationen i förhållande till potentiellt större prover av samma genomsekvens.

Experimentell validering innebär vanligen att SNP:n observeras i ytterligare prover som inte är relaterade till den ursprungliga uppsättningen kromosomer som undersöktes för att fastställa SNP:n. Därför kommer vanliga SNP:er att ”valideras” i högre grad än SNP:er med en riktigt sällsynt minor allel, eftersom det krävs större prover för att återfånga (och därmed bekräfta) den sällsynta variationen. Eftersom alla prover som används för att fastställa (upptäcka) SNP:er eller uppskatta deras allelfrekvenser i specifika populationsprov är av begränsad storlek, kommer det att finnas någon form av fastställelsebias i varje parti data som lämnas in till dbSNP.

Lämna en kommentar