Prateleira

O que é o viés de apuramento, e como se relaciona com o cálculo das frequências SNP?

Posicionamento de incerteza é um termo em genética populacional que descreve desvios sistemáticos de um resultado teórico esperado atribuível aos processos de amostragem usados para encontrar (determinar) SNPs e medir (estimar) suas frequências alélicas específicas da população.

A distribuição de frequências alélicas “derivadas” de SNP varia na natureza desde 1/2N (ou seja um cromossomo mutante em todo o pool genético da espécie), até 2N-1/2N (ou seja, apenas um cromossomo restante no pool genético da espécie para representar o estado alélico “ancestral”; todos os outros cromossomos têm o alelo derivado). Esta distribuição, entretanto, é imperfeitamente medida quando subamostras finitas são retiradas da população. Quanto menor a amostra finita utilizada no nosso processo de detecção (amostragem) do SNP, mais “imperfeito” é o ajuste entre a distribuição das frequências alélicas derivadas e a distribuição “verdadeira” na natureza. Aqui está um gráfico que ilustra o viés:

Image Content-Image003.jpg

Modificado a partir da Fig.2, Ref. (1).

Se os SNPs em dbSNP forem determinados em amostras de alguns cromossomas, então uma fração desses SNPs será excessivamente comum na população em relação a amostras potencialmente maiores da mesma seqüência genômica.

Validação experimental tipicamente significa observar o SNP em amostras adicionais não relacionadas ao conjunto original de cromossomas pesquisados para definir o SNP. Portanto, SNPs comuns “validarão” com uma taxa maior do que SNPs com um alelo menor realmente raro, porque amostras maiores são necessárias para recapturar (e, portanto, confirmar) a variação rara. Como todas as amostras usadas para verificar (descobrir) SNPs ou estimar suas frequências de alelos em amostras populacionais específicas são de tamanho finito, haverá algum tipo de viés de verificação em cada lote de dados submetidos ao dbSNP.

Deixe um comentário