Konsensussekvens

Udvikling af software til mønstergenkendelse er et vigtigt emne inden for genetik, molekylærbiologi og bioinformatik. Specifikke sekvensmotiver kan fungere som regulerende sekvenser, der styrer biosyntesen, eller som signalsekvenser, der leder et molekyle til et bestemt sted i cellen eller regulerer dets modning. Da disse sekvensers regulerende funktion er vigtig, antages det, at de er bevaret over lange perioder af evolutionen. I nogle tilfælde kan den evolutionære beslægtethed vurderes ud fra omfanget af bevarelse af disse steder.

NotationRediger

De bevarede sekvensmotiver kaldes konsensussekvenser, og de viser, hvilke rester der er bevaret, og hvilke rester der er variable. Tag følgende eksempel på en DNA-sekvens:

AN{A}YR

I denne notation betyder A, at der altid findes et A i den pågældende position; står for enten C eller T; N står for en hvilken som helst base; og {A} betyder en hvilken som helst base undtagen A. Y repræsenterer en hvilken som helst pyrimidin, og R angiver en hvilken som helst purin.

I dette eksempel giver notationen ikke nogen indikation af den relative hyppighed af C eller T, der forekommer i den pågældende position. En alternativ metode til at repræsentere en konsensussekvens anvender et sekvenslogo. Dette er en grafisk repræsentation af konsensussekvensen, hvor størrelsen af et symbol er relateret til den hyppighed, hvormed et givet nukleotid (eller en given aminosyre) forekommer på en bestemt position. I sekvenslogoer er symbolet for den pågældende rest tegnet større, jo mere bevaret resterne er, og jo mindre hyppigt de er, jo mindre er symbolet. Sekvenslogoer kan genereres ved hjælp af WebLogo eller ved hjælp af Gestalt Workbench, et offentligt tilgængeligt visualiseringsværktøj, der er skrevet af Gustavo Glusman på Institute for Systems Biology.

Skriv en kommentar