Een hoog polymorfe insertie in het Y-chromosoom amelogenine gen kan gebruikt worden voor evolutionaire biologie, populatiegenetica en geslachtsbepaling bij Cetacea en Artiodactyla

Amelogenine kan gebruikt worden voor moleculaire geslachtsbepaling en evolutionaire genetica bij Cetartiodactyla

Mplificatie van het bestudeerde segment van de amelogenine locus met behulp van de soortspecifieke SC1-SC2 primers resulteerde in een duidelijk geslachtsgerelateerd grootte polymorfisme bij alle Cetacea (Fig. 1) met een unieke 521 bp band voor wijfjes (twee Amel-X kopieën) en een extra 980 bp band voor de Amel-Y in mannetjes. Dit patroon was duidelijk bij mannelijke baleinwalvissen (Mysticetes) maar er was geen overeenkomstige Amel-X amplificatie bij mannelijke dolfijnen, tenzij met gebruikmaking van de primers X5-X6 afgeleid van de menselijke amelogenine-sequentie. Eerdere studies toonden aan dat amelogenine-amplificatie gevoelig was voor allelische drop-out of op zijn minst voor preferentiële amplificatie. Deze verschijnselen kunnen door verschillende factoren worden verklaard. Gewoonlijk wordt de amplificatie van het allel van geringere omvang bevoordeeld wanneer de hoeveelheid polymerase een beperkende factor is of in geval van degradatie van het template-DNA . Kleine hoeveelheden DNA kunnen ook de stochasticiteit van de annealing verhogen. Onze resultaten zijn echter niet consistent met deze situaties, aangezien het bevoordeelde allel (Amel-Y) altijd het grootste is. Anderzijds kunnen verschillen in GC-gehalte en mismatches in de annealing-sequenties de differentiële amplificatie verklaren. De amelogenine fragmenten die wij bestudeerden worden gekenmerkt door een hoger GC-gehalte wanneer ze geamplificeerd worden van het X-chromosoom (56%) dan van het Y-chromosoom (47%). Dit verschil kan het gevolg zijn van een niet-insertie in het Amel-X fragment. Deze eigenschap en een 2 bp lange mismatch tussen Amel-X van de dolfijn en het 5′-uiteinde van de omgekeerde primer SC2 (Fig. 2) kunnen de preferentiële amplificatie van de Y-kopie bij dolfijnen bevorderen (Fig. 1b). Inderdaad, amplificatie van mannelijke dolfijnmonsters SC3 (primer zonder mismatch, zie Fig. 2) in plaats van de SC2, herstelt de twee banden, gezien in baleinwalvissen. De aanwezigheid van deze grote insertie in het Amel-Y exemplaar kan worden gebruikt voor geslachtsbepaling bij waarschijnlijk alle walvissoorten.

Figuur 1

Sekse-gerelateerd groottepolymorfisme van amelogeninefragment bij walvisachtigen. (Molecuulgewicht markers is Biolabs’ 1 kb + ladder): a) Agarose gel die verschillen laat zien tussen de mannelijke amplificatie in een Balein (tandeloze) walvis (links van de ladder) en Getande walvissen (rechts). b) Agarose gel die verschillen laat zien tussen mannetjes en vrouwtjes in Gestreepte dolfijn. 1.000 bp band voor Amel-Y, 500 bp band voor Amel-X. Elke rijstrook vertegenwoordigt één monster (1 tot 5). De symbolen ♂ en ♀ staan voor respectievelijk mannelijke en vrouwelijke monsters.

Figuur 2

Gevolgorde-uitlijning van de oligonucleotideprimers met doelsequenties in Cetacea , Vee en Mens. De soorten en de chromosomale locatie zijn aan de rechterkant vermeld. De gearceerde kolommen geven de gemuteerde nucleotide in Dolfijnen weer. Accessie nummers van sequenties volgen: Dolfijnen (EMBL:AM744958-AM744964, EMBL:AM744970-AM744971, EMBL:AM744968, EMBL:AY787743S2 – Y en EMBL:AM744965 – X) en Walvissen (EMBL:AM744967, EMBL:AM744969 -X- en EMBL:AM744966 – Y), Runderen (GenBank:AB091789 -X- en GenBank:AB091790 – Y) en Mensen (GenBank:NT_011757 -X- van 9098117 tot 9098612 en GenBank:NC_000024 -Y- van 6796200 tot 6796719).

Om de breekpunten van de Y-invoegingsplaats te bepalen en de evolutionaire geschiedenis ervan te onderzoeken, hebben we verschillende walvisachtigen gesequenced (vermeld in Methoden; sequenties gedeponeerd onder de volgende accessies: EMBL:AM744958 tot AM744971). Na alignment met beschikbare sequenties van Artiodactyla (zie lijst in Methodes), ontdekten we hetzelfde polymorfisme in alle andere Cetartiodactyla behalve het Varken (Fig. 3): een insertie van 460-465 bp (de grootte is een functie van indels binnen verschillende individuen of soorten) gelegen tussen het 4de en 5de exon (188ste tot 651ste positie van Y-sequenties bv. EMBL:AM744958). De namen van de haplotypes en de corresponderende accessies zijn vermeld in tabel 1. De sequentieovereenkomst is gecontroleerd door BLAST (Basic Local Alignment Search Tool) uit te voeren op sequenties van de GenBank nr/nt nucleotidenverzameling met het megablast-algoritme (bedoeld voor sequenties met een grote overeenkomst). Naast de Amel-Y van runderen en schapen kwamen de enige twee relevante (78 en 83% homologie, E-waarden 4,10-68 en 3,10-53) treffers overeen met een fragment op het zevende chromosoom bij varkens (ca. 250 bp), wat suggereert dat de insertie een transposabel element zou kunnen zijn.

Tabel 1 Lijst van Amel-X- en Amel-Y-haplotypen bij walvisachtigen en hun EMBL-toetredingsnummers
Figuur 3

Schematische weergave van het geslachtsgebonden polymorfisme van de amelogeninelocus in een evolutionair perspectief. Insertie en intron 4 worden weergegeven door een witte balk, terwijl exon 5 in het zwart is weergegeven. Gearceerde balken staan voor afwezige gegevens, afgeleid uit evolutionaire verwantschappen. De verticale volgorde verwijst naar de “tree of life” weergave (volgens o.a.) rechts.

Wij interpreteren de aanwezigheid van deze insertie als een synapomorfie (gedeeld karakter) van de Cetartiodactyla met uitzondering van varkens en waarschijnlijk andere vroege afgeleide groepen (kamelen, nijlpaarden; , zie Fig. 3). Naast deze lange insertie werden 46 andere indels ontdekt door sequentie alignment (posities en afmetingen gedetailleerd in Figuur 5). Indels zijn bijzonder nuttig voor het testen van fylogenetische hypotheses, omdat ze informatie kunnen verschaffen over oude divergenties in plaats van informatie over populaties. Daarom hebben wij nagegaan of de fylogenetische topologieën verschilden als wij al dan niet rekening hielden met de informatie die deze indels bevatten. De sequenties van de walvisachtigen, samengevat in Tabel 1, en de Artiodactyla sequenties werden eerst klassiek geanalyseerd, met hiaten gecodeerd als ontbrekende karakters, en vervolgens met hiaten gecodeerd als aanvullende binaire karakters (zie Fig. 5). Voor elke analyse werden twee onafhankelijke Bayesiaanse zoekacties uitgevoerd. De fylogenetische bomen in figuur 4 zijn het resultaat van een consensus van 20.000 bomen, die bemonsterd werden nadat de standaardafwijking tussen de twee reeksen onder 0,01 was gezakt. Ze tonen hoog ondersteunde knooppunten. De fylogenetische analyse uitgevoerd op het complete segment (Fig. 4a) bevestigde de clustering naar geslachtschromosoomkopie in Cetartiodactyla (Stenella cœruleoalba, Balænoptera physalus, Grampus griseus, Tursiops truncatus, Bos taurus en Ovis aries) terwijl Amel-X en Amel-Y samen clusterden in andere zoogdieren (Homo sapiens, Sus scrofa) samen met Amel-X uit Cetartiodactyla. Anderzijds gaf de fylogenie die werd afgeleid zonder rekening te houden met de insertie een ander resultaat (Fig. 4b): terwijl de haplotypen bij de walvisachtigen ook per chromosoom geclusterd waren, kon bij de andere Cetartiodactyla geen signaal worden waargenomen dat verband hield met de geschiedenis van de soort of met de aanwezigheid van chromosomen. Het fylogenetische signaal met betrekking tot de soortgeschiedenis lijkt dus sterker te worden naarmate we de boom volgen van Cetartiodactyla naar primaten. Deze gedeeltelijke, homoplasische, persistentie van het fylogenetische signaal kan worden verklaard door de invloed van de regio rond de insertie. Dit zou het gevolg kunnen zijn van de ouderdom van de insertie (74-87 myrs ). Het daaropvolgende verlies aan homologie kan bij sommige taxa (Cetacea) tot een meer divergente evolutie tussen de chromosomen hebben geleid dan bij andere (Artiodactyla).

Figuur 4

Vergelijking van de fylogenetische bomen van de Amel-X- en Amel-Y-fragmenten die zijn afgeleid (a) met de insertie (b) zonder de insertie. (a) De fylogene boom van het volledige fragment toont trans-specifieke clustering per geslachtschromosoom in Cetartiodactyla. Tip labels zijn haplotypes zoals gedeponeerd in de EMBL database; Y en X zijn voor Amel-Y en Amel-X haplotypes respectievelijk. Stenella cœruleoalba haplotypes werden benoemd volgens populatie oorsprong (YA/Groep 1, YB/Groep 2, zie Methoden). (b) De afgeleide fylogenie na verwijdering van de insertie geeft een enigszins ander beeld: trans-specifieke clustering per geslachtschromosoom is verloren gegaan, behalve bij de walvisachtigen.

Figuur 5

Polymorfe plaatsen en indels in de Amel-X- en Amel-Y-regio’s bij de onderzochte walvisachtigen. (a) Bovenaan staan de posities van de nucleotiden en links de namen van de haplotypen. Alle posities zijn weergegeven op de eerste sequentie en elke overeenkomende nucleotide op de andere haplotypen wordt weergegeven door een stip. (b) Indels zijn genummerd (eerste rij) volgens hun volgorde op de uitgelijnde sequenties. Zij worden gekarakteriseerd door hun positie (tweede rij) en hun lengte (derde rij). In beide tabellen corresponderen de gearceerde gebieden met de regio waar de grote insertie zich bevindt.

Het zou interessant zijn deze regio op het niveau van de hele clade te bestuderen door sequentie- en indel-kenmerken in dezelfde analyse te combineren. Dit zou aanwijzingen kunnen geven om de vele hypotheses over de basale radiatie van de Cetartiodactyla te testen (b.v. ). Gezien de vermoedelijk basale positie van de Suioidea en Tylopoda in de Cetartiodactyla fylogenie ( en Fig. 3), stellen wij de hypothese dat de belangrijke evolutionaire gebeurtenis vertegenwoordigd door de insertie (geïllustreerd door een pijl Figuur 4a) een keer voorgedaan in de Cetacea-Ruminantia clade en niet in de resterende Cetartiodactyla.

De aanwezigheid van deze grote insertie in de Amel-Y kopie kan nuttig zijn voor geslachtsbepaling.

De evolutionaire geschiedenis geeft ook aan dat onze sexing techniek, naast walvisachtigen, toepasbaar is op een breed scala van Cetartiodactyla soorten, waaronder gedomesticeerde en wilde soorten, in het bijzonder de wijdverbreide Ruminantia (Bovidae, Capridae en hoogstwaarschijnlijk Cervidae). Het is echter niet geschikt voor Suiformes en verdere studies zijn nodig om te bevestigen dat de techniek ook niet toepasbaar is op Camelidae, gezien hun nog basalere positie in de Cetartiodactyla fylogenie.

Gebruik in stamboombeoordeling en populatiegenetica

In dolfijnen konden de Amel-Y fragmenten die geamplificeerd waren met het SC1-SC2 primerpaar gemakkelijk gesequeneerd worden zonder de noodzaak van klonering omdat de amplificatie Y-chromosoom-specifiek was. Van de tien gesequenteerde gestreepte dolfijnmonsters waren negen mannetjes, en we konden zeven verschillende Y-haplotypen afleiden (één haplotype vertegenwoordigd door drie individuen en vier individuele haplotypen) met 64 polymorfe sites (nucleotidediversiteit π = 0,004 ± 0,0007). De helft hiervan bevond zich in de ~460 bp insertie. Een uitlijning van polymorfe sites wordt gepresenteerd in figuur 5 (a). Opvallend is dat deze sequenties twee sterk divergerende haplogroepen vertoonden, met een gemiddelde van 49 substituties. Dit komt overeen met onze resultaten die het waarschijnlijke bestaan van twee ondersoorten in de Middellandse Zee ondersteunen (ongepubliceerde gegevens). Bovendien vertoonde één van deze haplogroepen een hoge graad van polymorfisme, met 24 informatieve sites, terwijl de andere er slechts acht vertoonden. Deze waarden zijn voldoende voor gebruik bij stamboomanalyse en populatiegenetica, als de Y-chromosoom tegenhanger van de mitochondriale d-lus bij deze soort. Bij de gestreepte dolfijn is de intra-specifieke (inter-groep) divergentie inderdaad groter dan de inter-specifieke divergentie, met een gemiddelde van 45 nucleotide-substituties tussen de sequenties van de gestreepte dolfijn en de vinvis. Er is een gemiddelde van 0,048 ± 0,01 substituties per site bij het vergelijken van de twee gestreepte dolfijnpopulaties. Dit is vergelijkbaar met de geconstateerde divergentie tussen elke populatie en de gewone dolfijn (0,058 ± 0,03) en bevestigt dat de nucleotiden-diversiteit een orde van grootte hoger is dan het bereik dat is waargenomen (10-4) voor Y-chromosoom-markers bij zoogdieren. Evenals voor de mitochondriale d-lus beperkt de grootte van het geamplificeerde fragment het gebruik van de techniek enigszins. Sommige gedegradeerde monsters amplificeren niet; toch was een bijzonder gedegradeerd potvismonster nog amplificeerbaar (gegevens niet weergegeven).

Omdat de Y-chromosomenpopulatie naar verwachting een kleine effectieve omvang heeft, is het waarschijnlijker dat deze door genetische drift wordt beïnvloed. Zij weerspiegelt dus meer recente demografische gebeurtenissen zoals knelpunten, expansies of founder-effecten. Om dit soort gebeurtenissen te bestuderen, heeft men een merker nodig waarvan de diversiteit hoog genoeg is om de reconstructie van genealogieën met zo weinig mogelijk dubbelzinnigheden mogelijk te maken en in gebieden waar recombinatie niet interfereert met de uniciteit van de bomen. Voor dit doel zijn zeer variabele microsatellieten waardevolle merkers, maar zij vereisen intensieve rekenmethoden om rekening te houden met onzekerheden in de bomen ten gevolge van allelen die identiek zijn door toestand en niet door afstamming (homoplasieën) . De toevoeging van een nieuwe sequentiemerker is derhalve van belang voor de Y-chromosoom populatiegenetica in Cetartiodactyla. Bovendien vertoont de Bayesiaanse schatting van de mutatiesnelheid op elke rand van beide bomen in Fig. 4, gezamenlijk berekend met de fylogenetische gevolgtrekking, hoge waarden voor een marker van kern-DNA: tussen 10-8 en 10-10 substituties per plaats en per jaar in alle takken van Cetartiodactyla. Deze waarde ligt tussen die van de mitochondriale d-lus en het nucleaire DNA bij zoogdieren.

Functionele perspectieven in de evolutie van amelogenine

Wij vonden twee stopcodons op aminozuurposities 98 en 99 van exon 5 in alle Y-chromosoom kopieën van amelogenine in de vier bestudeerde walvisachtigen (posities 988-993 van sequentie EMBL:AM744959). Het product van het Amel-Y gen kan daarom in deze soorten zijn afgekapt of een pseudogeen vertegenwoordigen, zoals reeds is waargenomen in soorten van de meeste andere eutherische clades

Plaats een reactie