Secuencia de consenso

El desarrollo de software para el reconocimiento de patrones es un tema importante en genética, biología molecular y bioinformática. Los motivos de secuencias específicas pueden funcionar como secuencias reguladoras que controlan la biosíntesis, o como secuencias de señalización que dirigen una molécula a un sitio específico dentro de la célula o regulan su maduración. Dado que la función reguladora de estas secuencias es importante, se cree que se conservan a lo largo de largos periodos de evolución. En algunos casos, el parentesco evolutivo puede estimarse por la cantidad de conservación de estos sitios.

NotaciónEditar

Los motivos de secuencias conservadas se denominan secuencias consenso y muestran qué residuos se conservan y qué residuos son variables. Considere el siguiente ejemplo de secuencia de ADN:

AN{A}YR

En esta notación, A significa que siempre se encuentra una A en esa posición; significa C o T; N representa cualquier base; y {A} significa cualquier base excepto A. Y representa cualquier pirimidina, y R indica cualquier purina.

En este ejemplo, la notación no da ninguna indicación de la frecuencia relativa de C o T que ocurre en esa posición. Un método alternativo para representar una secuencia de consenso utiliza un logotipo de secuencia. Se trata de una representación gráfica de la secuencia de consenso, en la que el tamaño de un símbolo está relacionado con la frecuencia con la que un determinado nucleótido (o aminoácido) aparece en una determinada posición. En los logotipos de secuencias, cuanto más conservado está el residuo, más grande se dibuja el símbolo de ese residuo; cuanto menos frecuente, más pequeño es el símbolo. Los logotipos de secuencias pueden generarse utilizando WebLogo, o utilizando el Gestalt Workbench, una herramienta de visualización disponible públicamente escrita por Gustavo Glusman en el Instituto de Biología de Sistemas.

Deja un comentario