Konsenzuální sekvence

Vývoj softwaru pro rozpoznávání vzorů je významným tématem v genetice, molekulární biologii a bioinformatice. Specifické sekvenční motivy mohou fungovat jako regulační sekvence řídící biosyntézu nebo jako signální sekvence, které směrují molekulu na určité místo v buňce nebo regulují její zrání. Vzhledem k tomu, že regulační funkce těchto sekvencí je důležitá, předpokládá se, že jsou zachovány napříč dlouhými obdobími evoluce. V některých případech lze evoluční příbuznost odhadnout podle míry zachování těchto míst.

ZápisUpravit

Zachované sekvenční motivy se nazývají konsenzuální sekvence a ukazují, která rezidua jsou zachována a která jsou variabilní. Uvažujme následující příklad sekvence DNA:

AN{A}YR

V tomto zápisu A znamená, že se na dané pozici vždy nachází A; znamená buď C, nebo T; N znamená jakoukoli bázi a {A} znamená jakoukoli bázi kromě A. Y představuje jakýkoli pyrimidin a R označuje jakýkoli purin.

V tomto příkladu zápis neuvádí žádnou relativní četnost výskytu C nebo T na dané pozici. Alternativní metoda reprezentace konsenzuální sekvence používá logo sekvence. Jedná se o grafické znázornění konsenzuální sekvence, v němž velikost symbolu souvisí s četností výskytu daného nukleotidu (nebo aminokyseliny) na určité pozici. V sekvenčním logu je symbol pro daný zbytek nakreslen tím větší, čím je zbytek konzervativnější; čím je méně častý, tím je symbol menší. Sekvenční loga lze vytvářet pomocí programu WebLogo nebo pomocí veřejně dostupného vizualizačního nástroje Gestalt Workbench, který napsal Gustavo Glusman z Institute for Systems Biology.

.

Napsat komentář