Contig peut également désigner les clones superposés qui forment une carte physique d’un chromosome lorsque la stratégie de séquençage descendant ou hiérarchique est utilisée. Dans cette méthode de séquençage, une carte à basse résolution est réalisée avant le séquençage afin de fournir un cadre pour guider l’assemblage ultérieur des lectures de séquence du génome. Cette carte identifie les positions relatives et le chevauchement des clones utilisés pour le séquençage. Les ensembles de clones qui se chevauchent et qui forment une portion contiguë d’ADN sont appelés contigs ; le nombre minimal de clones qui forment un contig qui couvre l’ensemble du chromosome constitue le chemin de tuilage utilisé pour le séquençage. Une fois qu’un chemin de tuilage a été sélectionné, les BAC qui le composent sont cisaillés en fragments plus petits et séquencés. Les contigs fournissent donc le cadre du séquençage hiérarchique. L’assemblage d’une carte de contigs comporte plusieurs étapes. Tout d’abord, l’ADN est cisaillé en morceaux plus grands (50-200 kb), qui sont clonés dans des BAC ou des PAC pour former une bibliothèque BAC. Puisque ces clones devraient couvrir l’ensemble du génome/chromosome, il est théoriquement possible d’assembler un contigu de BAC qui couvre l’ensemble du chromosome. La réalité, cependant, n’est pas toujours idéale. Des lacunes subsistent souvent, et un échafaudage – composé de contigs et de lacunes – qui couvre la région cartographique est souvent le premier résultat. Les lacunes entre les contigs peuvent être comblées par diverses méthodes décrites ci-dessous.
Construction de contigs BACEdit
Les contigs BAC sont construits en alignant des régions BAC dont le chevauchement est connu par diverses méthodes. Une stratégie commune consiste à utiliser la cartographie du contenu des sites marqués par une séquence (STS) pour détecter les sites d’ADN uniques en commun entre les BAC. Le degré de chevauchement est estimé approximativement par le nombre de marqueurs STS en commun entre deux clones, un plus grand nombre de marqueurs en commun signifiant un plus grand chevauchement. Comme cette stratégie ne fournit qu’une estimation très approximative du chevauchement, l’analyse des fragments de digestion par restriction, qui fournit une mesure plus précise du chevauchement des clones, est souvent utilisée. Dans cette stratégie, les clones sont traités avec une ou deux enzymes de restriction et les fragments résultants sont séparés par électrophorèse sur gel. Si deux clones, ils auront probablement des sites de restriction en commun, et partageront donc plusieurs fragments. Comme le nombre de fragments en commun et la longueur de ces fragments sont connus (la longueur est jugée par comparaison à un standard de taille), le degré de chevauchement peut être déduit avec un haut degré de précision.
Les lacunes entre les contigsEdit
Des lacunes subsistent souvent après la construction initiale des contigs BAC. Ces lacunes se produisent si la bibliothèque de chromosomes artificiels bactériens (BAC) criblée est peu complexe, ce qui signifie qu’elle ne contient pas un grand nombre de STS ou de sites de restriction, ou si certaines régions étaient moins stables dans les hôtes de clonage et donc sous-représentées dans la bibliothèque. Si des lacunes entre les contigs subsistent après la cartographie des points de repère STS et l’empreinte de restriction, le séquençage des extrémités des contigs peut être utilisé pour combler ces lacunes. Cette stratégie de séquençage des extrémités crée essentiellement un nouveau STS avec lequel on peut cribler les autres contigs. Alternativement, la séquence d’extrémité d’un contig peut être utilisée comme une amorce pour traverser l’écart.