Sequenza di consenso

Lo sviluppo di software per il riconoscimento di modelli è un argomento importante in genetica, biologia molecolare e bioinformatica. Motivi di sequenza specifici possono funzionare come sequenze di regolazione che controllano la biosintesi, o come sequenze di segnale che dirigono una molecola verso un sito specifico all’interno della cellula o ne regolano la maturazione. Poiché la funzione di regolazione di queste sequenze è importante, si pensa che siano conservate attraverso lunghi periodi di evoluzione. In alcuni casi, la parentela evolutiva può essere stimata dalla quantità di conservazione di questi siti.

NotazioneModifica

I motivi di sequenza conservati sono chiamati sequenze di consenso e mostrano quali residui sono conservati e quali sono variabili. Consideriamo il seguente esempio di sequenza di DNA:

AN{A}YR

In questa notazione, A significa che una A si trova sempre in quella posizione; sta per C o T; N sta per qualsiasi base; e {A} significa qualsiasi base tranne A. Y rappresenta qualsiasi pirimidina, e R indica qualsiasi purina.

In questo esempio, la notazione non dà alcuna indicazione della frequenza relativa di C o T che si verificano in quella posizione. Un metodo alternativo per rappresentare una sequenza di consenso utilizza un logo di sequenza. Si tratta di una rappresentazione grafica della sequenza di consenso, in cui la dimensione di un simbolo è legata alla frequenza con cui un dato nucleotide (o aminoacido) si verifica in una certa posizione. Nei loghi di sequenza, più il residuo è conservato, più grande è il simbolo disegnato per quel residuo; meno frequente, più piccolo è il simbolo. I loghi di sequenza possono essere generati usando WebLogo, o usando Gestalt Workbench, uno strumento di visualizzazione disponibile al pubblico scritto da Gustavo Glusman all’Istituto di Biologia dei Sistemi.

Lascia un commento