Amelogenin kan bruges til molekylær kønsbestemmelse og evolutionær genetik hos Cetartiodactyla
Amplificering af det undersøgte segment af amelogenin-lokus ved hjælp af de artsspecifikke SC1-SC2-primere resulterede i en tydelig kønsrelateret størrelsespolymorfisme hos alle Cetacea (Fig. 1) med et unikt 521 bp-bånd for hunner (to Amel-X-kopier) og et yderligere 980 bp-bånd for Amel-Y hos hanner. Dette mønster var tydeligt hos Baleen-hvaler (Mysticetes) af hankøn, men der var ingen tilsvarende Amel-X-amplifikation hos delfinhanner, medmindre man anvendte primerne X5-X6, der stammer fra den menneskelige amelogeninsekvens. Tidligere undersøgelser viste, at amelogenin-amplifikation var tilbøjelig til allelisk frafald eller i det mindste til at give præferenceamplifikation . Disse fænomener kan forklares ved flere faktorer. Normalt favoriseres amplifikation af den mindre store allel, når mængden af polymerase er en begrænsende faktor eller i tilfælde af nedbrydning af template-DNA . Små mængder DNA kan også øge stochasticiteten i annealingsprocessen. Vores resultater er imidlertid ikke i overensstemmelse med disse situationer, da den allel, der favoriseres (Amel-Y), altid er den største allel. På den anden side kan forskelle i GC-indholdet og mismatches i annealingsekvenserne være årsag til differentieret amplifikation. De amelogeninfragmenter, som vi har undersøgt, er karakteriseret ved et højere GC-indhold, når de er amplificeret fra X-kromosomet (56 %) end fra Y-kromosomet (47 %). Denne forskel kan skyldes en ikke-indsættelse i Amel-X-fragmentet. Dette træk samt et 2 bp langt mismatch mellem delfinens Amel-X og 5′-enden af den omvendte primer SC2 (Fig. 2) kan begunstige en præferentiel amplifikation af Y-kopien hos delfiner (Fig. 1b). Ved at amplificere delfinhannerprøver SC3 (primer uden mismatch, se Fig. 2) i stedet for SC2 genetableres de to bånd, som ses hos bardehvaler. Tilstedeværelsen af denne store insertion i Amel-Y-kopien kan bruges til kønsbestemmelse hos sandsynligvis alle hvalarter.
For at definere brudpunkterne for Y-indsættelsesstedet og undersøge dets udviklingshistorie sekventerede vi forskellige hvaler (anført i Metoder; sekvenser deponeret under følgende accessionsnumre: EMBL:AM744958 til AM744971). Efter alignment med tilgængelige sekvenser fra Artiodactyla (se listen i Methods) påviste vi den samme polymorfisme i alle andre Cetartiodactyla undtagen gris (Fig. 3): en 460-465 bp indsættelse (størrelsen er en funktion af indels inden for forskellige individer eller arter) placeret mellem 4. og 5. exon (188. til 651. position i Y-sekvenser, f.eks. EMBL:AM744958). Navnene på haplotyperne og de tilsvarende accessionsnumre er anført i tabel 1. Sekvensens lighed blev kontrolleret ved at køre BLAST (Basic Local Alignment Search Tool) over GenBank nr/nt-nukleotidsamlingssekvenser med megablast-algoritmen (beregnet til sekvenser med høj lighed). Ud over Amel-Y fra kvæg og får matchede de eneste to relevante (78 og 83 % homologi, E-værdier 4,10-68 og 3,10-53) hits et fragment på det syvende kromosom hos svin (ca. 250 bp), hvilket tyder på, at indsættelsen kan være et transposabelt element.
Vi fortolker tilstedeværelsen af denne insertion som en synapomorfi (fælles karakter) for Cetartiodactyla med undtagelse af svin og sandsynligvis andre tidlige afledte grupper (kameler, flodheste; , se fig. 3). Ud over denne lange indsættelse blev 46 andre indels påvist ved sekvensjustering (positioner og størrelser er beskrevet i figur 5). Indels er særligt nyttige til at teste fylogene hypoteser, da de kan give oplysninger om gamle divergenser snarere end oplysninger om populationer. Vi vurderede derfor, om de fylogenetiske topologier var forskellige, hvis vi tog hensyn til den information, der er indeholdt i disse indels, eller ikke. Således blev hvalsekvenserne, der er opsummeret i tabel 1, samt Artiodactyla-sekvenser analyseret først klassisk med huller kodet som manglende karakterer og dernæst med huller kodet som supplerende binære karakterer (se fig. 5). For hver analyse blev der udført to uafhængige bayesianske søgninger. De fylogenetiske træer, der er vist i figur 4, er resultatet af en konsensus af 20.000 træer, der er udtaget efter at standardafvigelsen mellem de to kørsler er faldet til under 0,01. De viser knuder med høj støtte. Den fylogenetiske analyse, der blev udført på det komplette segment (Fig. 4a), bekræftede grupperingen efter kønskromosomkopi i Cetartiodactyla (Stenella cœruleoalba, Balænoptera physalus, Grampus griseus, Tursiops truncatus, Bos taurus og Ovis aries), mens Amel-X og Amel-Y blev grupperet sammen i andre pattedyr (Homo sapiens, Sus scrofa) sammen med Amel-X fra Cetartiodactyla. På den anden side gav en fylogeni, der blev udledt uden at tage hensyn til indsættelsen, et andet resultat (Fig. 4b): mens haplotyperne også blev grupperet efter kromosom i hvaler, kunne der ikke ses noget signal relateret til hverken artshistorie eller kromosomholdelse i de andre Cetartiodactyla. Derfor synes det fylogenetiske signal relateret til artshistorie at blive styrket, efterhånden som vi følger træet fra Cetartiodactyla til primater. Denne delvise, homoplastiske persistens af det fylogenetiske signal kan forklares ved indflydelsen fra den region, der omgiver indsættelsen. Dette kan være et resultat af den gamle alder af indsættelsen (74-87 myrs ). Det efterfølgende tab af homologi kan have givet anledning til en mere divergerende udvikling mellem kromosomerne i nogle taxa (Cetacea) end i andre (Artiodactyla).
Det ville være interessant at undersøge denne region på hele kladeniveau ved at kombinere sekvens- og indelkarakterer i den samme analyse. Dette kunne give ledetråde til at teste de mange hypoteser om basalstråling af Cetartiodactyla (f.eks. ). I betragtning af Suioidea og Tylopoda’s formodentlig basale position i Cetartiodactyla-fylogenien ( og Fig. 3), opstiller vi den hypotese, at den store evolutionære begivenhed, der repræsenteres af indsættelsen (illustreret med en pil Figur 4a), fandt sted én gang i kladen Cetacea-Ruminantia og ikke i de resterende Cetartiodactyla.
Forsekomsten af denne store insertion i Amel-Y-kopien kan være nyttig til kønsbestemmelse.
Evolutionshistorien viser også, at vores kønsbestemmelsesteknik ud over hvaler kan anvendes på over en bred vifte af Cetartiodactyla-arter, herunder tamme og vilde arter, især de udbredte Ruminantia (Bovidae, Capridae og højst sandsynligt Cervidae). Den er dog ikke egnet til Suiformes, og der er behov for yderligere undersøgelser for at bekræfte, at teknikken heller ikke kan anvendes på Camelidae i betragtning af deres endnu mere basale position i Cetartiodactyla-fylogenien.
Anvendelse i stamtavlevurdering og populationsgenetik
I delfiner blev de Amel-Y-fragmenter, der blev amplificeret med primerparret SC1-SC2, let sekventeret uden behov for kloning, da amplifikationen var Y-kromosomspecifik. Af de ti sekventerede prøver af stribet delfin var ni hanner, og vi kunne udlede syv forskellige Y-haplotyper (en haplotype repræsenteret af tre individer og fire individuelle haplotyper) med 64 polymorfe steder (nukleotiddiversitet π = 0,004 ± 0,0007). Halvdelen af disse var i indsættelsen på ~460 bp. En tilpasning af de polymorfe steder er vist i figur 5 (a). Det er påfaldende, at disse sekvenser viste to meget divergerende haplogrupper, der i gennemsnit adskiller sig med 49 substitutioner. Dette stemmer overens med vores resultater, der understøtter den sandsynlige eksistens af to underarter i Middelhavet (upublicerede data). Desuden udviste en af disse haplogrupper en høj grad af polymorphisme med 24 informative steder, mens de andre kun udviste otte. Disse værdier er tilstrækkelige til brug i stamtræanalyser og populationsgenetik, da Y-kromosomets modstykke til den mitokondrielle d-loop hos denne art er tilstrækkelig. Hos den stribede delfin er den intraspecifikke divergens (mellem grupperne) faktisk større end den interspecifikke divergens med et gennemsnit på 45 nukleotid-substitutioner mellem sekvenserne af den stribede delfin og finhvalen. Der er et gennemsnit på 0,048 ± 0,01 substitutioner pr. sted, når man sammenligner de to stribet delfinpopulationer. Dette kan sammenlignes med den divergens, der er observeret mellem hver population og den almindelige delfin (0,058 ± 0,03), og det bekræfter, at nukleotiddiversiteten er en størrelsesorden højere end det interval, der er observeret (10-4) for Y-kromosommarkører hos pattedyr . Som for den mitokondrielle d-loop begrænser størrelsen af det forstærkede fragment en smule anvendelsen af denne teknik. Nogle nedbrudte prøver forstærkes ikke; alligevel var en særlig nedbrudt kaskelothvalprøve stadig amplificerbar (data ikke vist)
Da Y-kromosompopulationen forventes at have en lille effektiv størrelse, er det mere sandsynligt, at den vil blive påvirket af genetisk drift. Den afspejler således nyere demografiske begivenheder såsom flaskehalse, ekspansioner eller stiftereffekter . For at studere denne type hændelser har man brug for en markør, hvis diversitet er tilstrækkelig stor til at muliggøre en rekonstruktion af genealogier med færrest tvetydigheder og i områder, hvor rekombination ikke forstyrrer træernes entydighed. Til dette formål er meget variable mikrosatellitter værdifulde markører, men de kræver intensive beregningsmetoder for at tage højde for usikkerheder i træerne, der skyldes alleler, som er identiske i henhold til tilstand og ikke i henhold til afstamning (homoplasier) . Tilføjelse af en ny sekvensmarkør er derfor af interesse for Y-kromosompopulationsgenetik i Cetartiodactyla. Desuden viser det Bayesianske estimat af mutationsraten på hver kant af begge træer i Fig. 4, der er beregnet i fællesskab med fylogenetisk inferens, høje værdier for en markør af nukleært DNA: mellem 10-8 og 10-10 substitutioner pr. sted og pr. år i alle Cetartiodactyla-grene. Denne værdi ligger mellem værdierne for mitokondriel d-loop og kerne-DNA hos pattedyr.
Funktionelle perspektiver i amelogenin evolution
Vi fandt to stopkodoner på aminosyrepositionerne 98 og 99 i exon 5 i alle Y-kromosomkopier af amelogenin i de fire undersøgte hvalarter (positioner 988-993 i sekvens EMBL:AM744959). Amel-Y-genproduktet kan derfor være afkortet hos disse arter eller repræsentere et pseudogen som allerede observeret hos arter fra de fleste af de andre eutheriske klasser