Konsensussekvens

Utveckling av programvara för mönsterigenkänning är ett viktigt ämne inom genetik, molekylärbiologi och bioinformatik. Specifika sekvensmotiv kan fungera som regleringssekvenser som styr biosyntesen eller som signalsekvenser som styr en molekyl till en specifik plats i cellen eller reglerar dess mognad. Eftersom dessa sekvensers reglerande funktion är viktig antas de vara bevarade under långa perioder av evolutionen. I vissa fall kan evolutionär släktskap uppskattas utifrån hur mycket dessa platser är bevarade.

NotationEdit

De bevarade sekvensmotiven kallas konsensussekvenser och de visar vilka rester som är bevarade och vilka rester som är variabla. Betrakta följande exempel på DNA-sekvens:

AN{A}YR

I denna notation betyder A att ett A alltid återfinns i den positionen; står för antingen C eller T; N står för vilken bas som helst; och {A} betyder vilken bas som helst utom A. Y representerar vilken pyrimidin som helst och R indikerar vilken purin som helst.

I det här exemplet ger notationen inte någon indikation på den relativa frekvensen av att C eller T förekommer i den positionen. En alternativ metod för att representera en konsensussekvens är att använda en sekvenslogotyp. Detta är en grafisk representation av konsensussekvensen, där storleken på en symbol är relaterad till frekvensen av att en viss nukleotid (eller aminosyra) förekommer på en viss position. I sekvenslogotyper är symbolen för denna rest större ju mer bevarad den är, och ju mindre frekvent den är, desto mindre är symbolen. Sekvenslogotyper kan genereras med WebLogo eller med Gestalt Workbench, ett allmänt tillgängligt visualiseringsverktyg som skrivits av Gustavo Glusman vid Institute for Systems Biology.

Lämna en kommentar