Une insertion hautement polymorphe dans le gène de l’amélogénine du chromosome Y peut être utilisée pour la biologie évolutive, la génétique des populations et le sexage chez les Cetacea et Artiodactyla

L’amélogénine peut être utilisée pour le sexage moléculaire et la génétique de l’évolution chez les Cetartiodactyla

L’amplification du segment étudié du locus de l’amélogénine à l’aide des amorces SC1-SC2 spécifiques aux espèces a entraîné un polymorphisme de taille évident lié au sexe chez tous les Cetacea (Fig. 1) avec une bande unique de 521 pb pour les femelles (deux copies d’Amel-X) et une bande supplémentaire de 980 pb pour l’Amel-Y chez les mâles. Ce schéma était évident chez les baleines à fanons (Mysticetes) mâles, mais il n’y avait pas d’amplification correspondante de l’Amel-X chez les dauphins mâles, sauf en utilisant les amorces X5-X6 dérivées de la séquence d’amélogénine humaine. Des études antérieures ont montré que l’amplification de l’amélogénine était sujette à l’abandon des allèles ou du moins à une amplification préférentielle. Ces phénomènes peuvent être expliqués par plusieurs facteurs. Habituellement, l’amplification de l’allèle le plus petit est favorisée lorsque la quantité de polymérase est un facteur limitant ou en cas de dégradation de l’ADN matrice. De petites quantités d’ADN peuvent également augmenter la stochasticité du recuit. Cependant, nos résultats ne correspondent pas à ces situations puisque l’allèle favorisé (Amel-Y) est toujours le plus grand. D’autre part, les différences de contenu GC et les mésappariements dans les séquences de recuit peuvent expliquer l’amplification différentielle. Les fragments d’amélogénine que nous avons étudiés sont caractérisés par un contenu GC plus élevé lorsqu’ils sont amplifiés à partir du chromosome X (56%) que du chromosome Y (47%). Cette différence peut résulter d’une non-insertion dans le fragment Amel-X. Cette caractéristique ainsi qu’un mismatch de 2 pb de long entre l’Amel-X du dauphin et l’extrémité 5′ de l’amorce inverse SC2 (Fig. 2) peuvent favoriser l’amplification préférentielle de la copie Y chez les dauphins (Fig. 1b). En effet, l’amplification des échantillons de dauphins mâles SC3 (amorce sans mismatch, voir Fig. 2) au lieu de la SC2, rétablit les deux bandes, observées chez les baleines à fanons. La présence de cette grande insertion dans la copie Amel-Y peut être utilisée pour la détermination du sexe chez probablement toutes les espèces de cétacés.

Figure 1

Polymorphisme de taille lié au sexe du fragment d’amélogénine chez les Cétacés. (Les marqueurs de poids moléculaire sont l’échelle 1 kb + de Biolabs) : a) Gel d’agarose montrant les différences entre l’amplification mâle chez une baleine à fanons (sans dents) (à gauche de l’échelle) et les baleines à dents (à droite). b) Gel d’agarose montrant les différences entre les mâles et les femelles chez le dauphin rayé. Bande de 1 000 pb pour Amel-Y, bande de 500 pb pour Amel-X. Chaque voie représente un seul échantillon (n°1 à 5). Les symboles ♂ et ♀ correspondent respectivement aux échantillons mâles et femelles.

Figure 2

Alignement de séquence des amorces oligonucléotidiques avec les séquences cibles chez les Cétacés , les Bovins et l’Homme. L’espèce et l’emplacement chromosomique sont indiqués sur le côté droit. Les colonnes grisées représentent le nucléotide muté chez les dauphins. Les numéros d’accession des séquences suivent : Dauphins (EMBL:AM744958-AM744964, EMBL:AM744970-AM744971, EMBL:AM744968, EMBL:AY787743S2 – Y et EMBL:AM744965 – X) et Baleines (EMBL:AM744967, EMBL:AM744969 -X- et EMBL :AM744966 – Y), les bovins (GenBank:AB091789 -X- et GenBank:AB091790 – Y) et l’homme (GenBank:NT_011757 -X- de 9098117 à 9098612 et GenBank:NC_000024 -Y- de 6796200 à 6796719).

Afin de définir les points de rupture de l’emplacement de l’insertion Y et d’étudier son histoire évolutive, nous avons séquencé divers cétacés (énumérés dans Méthodes ; séquences déposées sous les accessions suivantes : EMBL:AM744958 à AM744971). Après alignement avec les séquences disponibles d’Artiodactyla (voir liste dans Méthodes), nous avons détecté le même polymorphisme chez tous les autres Cetartiodactyla à l’exception du Cochon (Fig. 3) : une insertion de 460-465 bp (la taille est fonction des indels au sein de différents individus ou espèces) située entre les 4ème et 5ème exons (188ème à 651ème position des séquences Y par exemple EMBL:AM744958). Les noms des haplotypes et leurs accessions correspondantes sont donnés dans le tableau 1. La similarité des séquences a été vérifiée en exécutant BLAST (Basic Local Alignment Search Tool) sur les séquences de la collection de nucléotides GenBank nr/nt avec l’algorithme megablast (destiné aux séquences de haute similarité). En plus de l’Amel-Y bovin et ovin, les deux seules occurrences pertinentes (78 et 83% d’homologie, valeurs E 4.10-68 et 3.10-53) correspondaient à un fragment sur le septième chromosome chez le porc (environ 250 pb), ce qui suggère que l’insertion pourrait être un élément transposable.

Tableau 1 Liste des noms des haplotypes Amel-X et Amel-Y chez les Cétacés et leurs numéros d’accession EMBL
Figure 3

Représentation schématique du polymorphisme lié au sexe du locus de l’amélogénine dans une perspective évolutive. L’insertion et l’intron 4 sont représentés par une barre blanche, tandis que l’exon 5 est en noir. Les barres grisées représentent les données absentes, déduites des relations évolutives. L’ordre vertical renvoie à la vue « arbre de vie » (selon entre autres) fournie à droite.

Nous interprétons la présence de cette insertion comme une synapomorphie (caractère partagé) des Cetartiodactyla excluant les porcs et probablement d’autres groupes dérivés précoces (chameaux, hippopotames ; , voir Fig. 3). En plus de cette longue insertion, 46 autres indels ont été détectés par alignement de séquences (positions et tailles détaillées dans la figure 5). Les indels sont particulièrement utiles pour tester les hypothèses phylogéniques, car ils peuvent fournir des informations sur les divergences anciennes plutôt que sur les populations. Nous avons donc évalué si les topologies phylogénétiques différaient si nous prenions en compte ou non les informations contenues dans ces indels. Ainsi, les séquences de cétacés résumées dans le tableau 1 ainsi que les séquences d’Artiodactyla ont été analysées d’abord classiquement, avec des indels codés comme des caractères manquants, et ensuite, avec des indels codés comme des caractères binaires supplémentaires (voir Fig. 5). Pour chaque analyse, deux recherches bayésiennes indépendantes ont été effectuées. Les arbres phylogénétiques présentés dans la figure 4 résultent d’un consensus de 20 000 arbres échantillonnés après que la déviation standard entre les deux séries soit tombée en dessous de 0,01. Ils montrent des nœuds fortement soutenus. L’analyse phylogénétique effectuée sur le segment complet (figure 4a) a confirmé le regroupement par copie de chromosome sexuel chez les Cetartiodactyla (Stenella cœruleoalba, Balænoptera physalus, Grampus griseus, Tursiops truncatus, Bos taurus et Ovis aries), tandis que Amel-X et Amel-Y se sont regroupés chez d’autres mammifères (Homo sapiens, Sus scrofa) avec Amel-X de Cetartiodactyla. D’autre part, la phylogénie déduite sans tenir compte de l’insertion a donné un résultat différent (Fig. 4b) : alors que les haplotypes sont également regroupés par chromosome chez les cétacés, aucun signal lié à l’histoire des espèces ou au portage des chromosomes n’a pu être observé chez les autres Cetartiodactyla. Par conséquent, le signal phylogénétique lié à l’histoire des espèces semble se renforcer à mesure que l’on suit l’arbre de Cetartiodactyla vers les primates. Cette persistance partielle, homoplasique, du signal phylogénétique peut s’expliquer par l’influence de la région entourant l’insertion. Cela pourrait être le résultat de l’âge avancé de l’insertion (74-87 myrs ). La perte d’homologie subséquente peut avoir donné lieu à une évolution plus divergente entre les chromosomes chez certains taxons (Cetacea) que chez d’autres (Artiodactyla).

Figure 4

Comparaison des arbres phylogéniques des fragments Amel-X et Amel-Y déduits (a) avec l’insertion (b) sans l’insertion. (a) L’arbre phylogénique du fragment complet montre un regroupement trans-spécifique par chromosome sexuel chez Cetartiodactyla. Les étiquettes des extrémités sont des haplotypes tels que déposés dans la base de données EMBL ; Y et X correspondent respectivement aux haplotypes Amel-Y et Amel-X. Les haplotypes de Stenella cœruleoalba ont été nommés selon l’origine de la population (YA/Groupe 1, YB/Groupe 2, voir Méthodes). (b) La phylogénie inférée après avoir supprimé l’insertion donne une image légèrement différente : le regroupement trans-spécifique par chromosome sexuel est perdu sauf chez les Cétacés.

Figure 5

Sites polymorphes et indels dans les régions Amel-X et Amel-Y chez les espèces de Cétacés étudiées. (a) Les positions nucléotidiques sont représentées au-dessus et à gauche les noms des haplotypes. Toutes les positions sont représentées sur la première séquence et chaque nucléotide correspondant sur les autres haplotypes est représenté par un point. (b) Les indels sont numérotés (première ligne) en suivant leur ordre sur les séquences alignées. Ils sont caractérisés par leur position (deuxième ligne) et leur longueur (troisième ligne). Dans les deux tableaux, les zones ombrées correspondent à la région contenant la grande insertion.

Il serait intéressant d’étudier cette région au niveau du clade entier en combinant les caractères de séquence et d’indel dans la même analyse. Cela pourrait donner des indices pour tester les nombreuses hypothèses sur la radiation basale de Cetartiodactyla (par exemple ). Étant donné la position vraisemblablement basale des Suioidea et des Tylopoda dans la phylogénie des Cetartiodactyla ( et Fig. 3), nous émettons l’hypothèse que l’événement évolutif majeur représenté par l’insertion (illustrée par une flèche Figure 4a) s’est produit une fois dans le clade Cetacea-Ruminantia et non dans le reste des Cetartiodactyla.

La présence de cette grande insertion dans la copie Amel-Y peut être utile pour la détermination du sexe.

L’histoire évolutive indique également que notre technique de sexage est applicable, en plus des cétacés, à plus d’une large gamme d’espèces Cetartiodactyla, y compris les espèces domestiques et sauvages, en particulier les Ruminantia répandus (Bovidae, Capridae et très probablement Cervidae). Elle n’est cependant pas adaptée aux Suiformes et des études supplémentaires sont nécessaires pour confirmer que la technique n’est pas non plus applicable aux Camélidés, étant donné leur position encore plus basale dans la phylogénie des Cetartiodactyla.

Utilisation dans l’évaluation du pedigree et la génétique des populations

Chez les dauphins, les fragments Amel-Y amplifiés avec la paire d’amorces SC1-SC2 ont été facilement séquencés sans avoir besoin de clonage puisque l’amplification était spécifique du chromosome Y. Des dix échantillons de dauphins rayés séquencés, neuf étaient des mâles, et nous avons pu déduire sept haplotypes Y distincts (un haplotype représenté par trois individus et quatre haplotypes individuels) portant 64 sites polymorphes (diversité nucléotidique π = 0,004 ± 0,0007). La moitié de ces sites se trouvaient dans l’insertion de ~460 pb. Un alignement des sites polymorphes est présenté dans la figure 5 (a). Il est frappant de constater que ces séquences montrent deux haplogroupes hautement divergents, divergeant d’une moyenne de 49 substitutions. Ceci concorde avec nos résultats qui soutiennent l’existence probable de deux sous-espèces au sein de la mer Méditerranée (données non publiées). De plus, l’un de ces haplogroupes présentait un degré élevé de polymorphisme, avec 24 sites informatifs, alors que les autres n’en présentaient que huit. Ces valeurs sont suffisantes pour être utilisées dans l’analyse du pedigree et la génétique des populations, car il s’agit de la contrepartie sur le chromosome Y de la boucle d mitochondriale chez cette espèce. En effet, chez le dauphin rayé, la divergence intra-spécifique (inter-groupe) est plus importante que la divergence inter-spécifique avec une moyenne de 45 substitutions nucléotidiques entre les séquences du dauphin rayé et du rorqual commun. Il y a une moyenne de 0,048 ± 0,01 substitutions par site lorsque l’on compare les deux populations de dauphins rayés. Ce chiffre est comparable à la divergence observée entre chaque population et le dauphin commun (0,058 ± 0,03) et confirme que la diversité nucléotidique est d’un ordre de grandeur supérieur à la fourchette observée (10-4) pour les marqueurs du chromosome Y chez les mammifères . Comme pour la d-loop mitochondriale, la taille du fragment amplifié limite légèrement l’utilisation de la technique. Certains échantillons dégradés ne s’amplifient pas ; malgré cela, un échantillon de cachalot particulièrement dégradé était encore amplifiable (données non présentées).

Comme la population de chromosomes Y devrait avoir une petite taille effective, elle est plus susceptible d’être affectée par la dérive génétique. Ainsi, elle reflète des événements démographiques plus récents tels que des goulots d’étranglement, des expansions ou des effets fondateurs . Pour étudier ce type d’événement, il faut un marqueur dont la diversité est suffisamment élevée pour permettre la reconstruction de généalogies avec le moins d’ambiguïtés possible et dans des régions où la recombinaison n’interfère pas avec l’unicité des arbres. A cet effet, les microsatellites très variables représentent des marqueurs précieux mais ils nécessitent des méthodes de calcul intensives pour prendre en compte les incertitudes dans les arbres provenant d’allèles identiques par état et non par descendance (homoplasies) . L’ajout d’un nouveau marqueur de séquence est donc intéressant pour la génétique des populations du chromosome Y chez les Cetartiodactyla. De plus, l’estimation bayésienne du taux de mutation sur chaque bord des deux arbres de la Fig. 4, calculée conjointement avec l’inférence phylogénétique, montre des valeurs élevées pour un marqueur de l’ADN nucléaire : entre 10-8 et 10-10 substitutions par site et par an dans toutes les branches de Cetartiodactyla. Cette valeur est intermédiaire entre celles de la boucle d mitochondriale et de l’ADN nucléaire chez les mammifères .

Perspectives fonctionnelles dans l’évolution de l’amélogénine

Nous avons trouvé deux codons stop aux positions d’acides aminés 98 et 99 de l’exon 5 dans toutes les copies du chromosome Y de l’amélogénine chez les quatre espèces de cétacés étudiées (positions 988-993 de la séquence EMBL:AM744959). Le produit du gène Amel-Y peut donc être tronqué chez ces espèces ou représenter un pseudogène comme déjà observé chez les espèces de la plupart des autres clades euthériens

.

Laisser un commentaire