Consensussequentie

De ontwikkeling van software voor patroonherkenning is een belangrijk onderwerp in de genetica, moleculaire biologie en bio-informatica. Specifieke sequentiemotieven kunnen fungeren als regulerende sequenties die de biosynthese regelen, of als signaalsequenties die een molecule naar een specifieke plaats in de cel leiden of de rijping ervan regelen. Aangezien de regulerende functie van deze sequenties belangrijk is, wordt aangenomen dat zij over lange perioden van evolutie geconserveerd zijn. In sommige gevallen kan evolutionaire verwantschap worden geschat aan de hand van de mate van behoud van deze plaatsen.

NotatieEdit

De geconserveerde sequentiemotieven worden consensussequenties genoemd en zij laten zien welke residuen geconserveerd zijn en welke residuen variabel zijn. Beschouw het volgende voorbeeld van een DNA-sequentie:

AN{A}YR

In deze notatie betekent A dat op die positie altijd een A voorkomt; staat voor C of T; N staat voor elke base; en {A} betekent elke base behalve A. Y staat voor elke pyrimidine, en R voor elke purine.

In dit voorbeeld geeft de notatie geen enkele aanwijzing over de relatieve frequentie van C of T die op die positie voorkomt. Een alternatieve methode om een consensussequentie weer te geven maakt gebruik van een sequentielogo. Dit is een grafische voorstelling van de consensussequentie, waarbij de grootte van een symbool gerelateerd is aan de frequentie waarmee een bepaald nucleotide (of aminozuur) op een bepaalde positie voorkomt. In sequentielogo’s geldt: hoe meer het residu geconserveerd is, hoe groter het symbool voor dat residu is getekend; hoe minder frequent, hoe kleiner het symbool. Sequentielogo’s kunnen worden gegenereerd met WebLogo, of met de Gestalt Workbench, een openbaar beschikbaar visualisatie-instrument geschreven door Gustavo Glusman aan het Institute for Systems Biology.

Plaats een reactie