パターン認識のためのソフトウェアの開発は、遺伝学、分子生物学、バイオインフォマティクスの主要なトピックである。 特定の配列モチーフは、生合成を制御する制御配列として、あるいは、分子を細胞内の特定の部位に誘導したり、成熟を制御するシグナル配列として機能することができる。 これらの配列の制御機能は重要であるため、長い進化の中で保存されてきたと考えられている。
NotationEdit
保存された配列モチーフはコンセンサス配列と呼ばれ、どの残基が保存され、どの残基が可変であるかを示しています。 次の DNA 配列の例を考えてみましょう。
AN{A}YR
この表記法では、A はその位置に常に A があることを意味し、C または T を表し、N は任意の塩基を表し、{A} は A 以外の任意の塩基を表します。Y は任意のピリミジン、R は任意の purine を示します。
この例では、C または T がその位置に生じる相対頻度を示すものではありません。 コンセンサス配列を表現する別の方法として、配列ロゴを用いる方法がある。 これはコンセンサス配列を図式化したもので、記号の大きさが、あるヌクレオチド(またはアミノ酸)がある位置に出現する頻度と関連している。 配列ロゴでは、保存されている残基ほどその残基の記号が大きく描かれ、頻度が低いほど記号は小さくなります。 配列ロゴは WebLogo か、システム生物学研究所の Gustavo Glusman によって書かれた一般に利用可能な可視化ツールである Gestalt Workbench を使って作成することができる。