Dezvoltarea de software pentru recunoașterea modelelor este un subiect major în genetică, biologie moleculară și bioinformatică. Motive de secvențe specifice pot funcționa ca secvențe de reglare care controlează biosinteza sau ca secvențe de semnal care direcționează o moleculă către un anumit loc în interiorul celulei sau reglează maturarea acesteia. Având în vedere că funcția de reglementare a acestor secvențe este importantă, se crede că ele sunt conservate de-a lungul unor perioade lungi de evoluție. În unele cazuri, înrudirea evolutivă poate fi estimată prin gradul de conservare a acestor situsuri.
NotațieEdit
Motivele secvențelor conservate se numesc secvențe consens și arată ce resturi sunt conservate și ce resturi sunt variabile. Luați în considerare următorul exemplu de secvență de ADN:
AN{A}YR
În această notație, A înseamnă că un A se găsește întotdeauna în acea poziție; reprezintă fie C, fie T; N reprezintă orice bază; iar {A} înseamnă orice bază cu excepția lui A. Y reprezintă orice pirimidină, iar R indică orice purină.
În acest exemplu, notația nu oferă nici o indicație privind frecvența relativă a apariției lui C sau T în acea poziție. O metodă alternativă de reprezentare a unei secvențe consensuale utilizează un logo de secvență. Aceasta este o reprezentare grafică a secvenței consensuale, în care dimensiunea unui simbol este legată de frecvența cu care o anumită nucleotidă (sau aminoacid) apare într-o anumită poziție. În logo-urile de secvență, cu cât reziduul este mai conservat, cu atât este desenat un simbol mai mare pentru reziduul respectiv; cu cât este mai puțin frecvent, cu atât simbolul este mai mic. Logourile de secvență pot fi generate cu ajutorul WebLogo, sau cu ajutorul Gestalt Workbench, un instrument de vizualizare disponibil publicului, scris de Gustavo Glusman la Institutul pentru Biologie Sistemică.
.