Amelogeniinia voidaan käyttää molekulaariseen sukupuolenmääritykseen ja evoluutiogenetiikkaan Cetartiodactylailla
Amelogeniinilokuksen tutkittavan segmentin monistaminen lajispesifisillä SC1-SC2-alkukkeilla johti selvään sukupuoleen liittyvään kokopolymorfismiin kaikilla Cetaceoilla (Kuva. 1. Naaraiden kohdalla oli ainutlaatuinen 521 bp:n kaista (kaksi Amel-X-kopiota) ja urosten kohdalla lisäksi 980 bp:n kaista Amel-Y:lle. Tämä kuvio oli ilmeinen urospuolisilla baleenivalailla (Mysticetes), mutta urospuolisilla delfiineillä ei ollut vastaavaa Amel-X-monistusta, paitsi jos käytettiin ihmisen amelogeniinisekvenssistä johdettuja alukkeita X5-X6. Aiemmat tutkimukset osoittivat, että amelogeniinin amplifikaatio oli altis alleelien häviämiselle tai ainakin ensisijaiselle monistumiselle. Nämä ilmiöt voidaan selittää useilla tekijöillä. Yleensä pienemmän kokoisen alleelin monistumista suositaan, kun polymeraasin määrä on rajoittava tekijä tai jos templaatti-DNA hajoaa . Pienet DNA-määrät voivat myös lisätä annealingin stokastisuutta. Tuloksemme eivät kuitenkaan vastaa näitä tilanteita, sillä suosittu alleeli (Amel-Y) on aina suurin. Toisaalta erot GC-pitoisuudessa ja epäsuhtaisuudet annealing-sekvensseissä voivat selittää erilaisen monistumisen. Tutkimillemme amelogeniinifragmenteille on ominaista suurempi GC-pitoisuus, kun ne monistetaan X-kromosomista (56 %) kuin Y-kromosomista (47 %). Tämä ero voi johtua siitä, että Amel-X-fragmentissa ei ole inserttiä. Tämä ominaisuus sekä 2 bp:n pituinen epäsuhta delfiinin Amel-X:n ja käänteisen alukkeen SC2:n 5′-loppuosan välillä (kuva 2) saattavat suosia Y-kopion monistamista delfiineissä (kuva 1b). Itse asiassa urosdelfiininäytteiden monistaminen SC2:n sijasta SC3:lla (alukkeella, jossa ei ole yhteensopimattomuutta, ks. kuva 2) palauttaa kaksi nauhaa, jotka on havaittu paaluvalaissa. Tämän suuren insertion esiintymistä Amel-Y-kopiossa voidaan käyttää sukupuolen määrittämiseen todennäköisesti kaikilla valaslajeilla.
Määrittääksemme Y-insertiokohdan murtumispisteet ja tutkiaksemme sen evoluutiohistoriaa sekvensoimme erilaisia valaita (lueteltu Menetelmissä; sekvenssit talletettu seuraaviin liittymiin: EMBL:AM744958-AM744971). Kohdistettuamme ne saatavilla oleviin Artiodactyla-sekvensseihin (ks. luettelo menetelmissä) havaitsimme saman polymorfismin kaikissa muissa Cetartiodactyla-lajeissa paitsi siassa (kuva 3): 460-465 bp:n insertio (koko riippuu indeleistä eri yksilöiden tai lajien sisällä), joka sijaitsee 4. ja 5. eksonin välissä (188.-651. kohta Y-sekvensseissä, esim. EMBL:AM744958). Haaplotyyppien nimet ja niitä vastaavat liittymät on esitetty taulukossa 1. Sekvenssien samankaltaisuus tarkistettiin ajamalla BLAST (Basic Local Alignment Search Tool) GenBankin nr/nt-nukleotidikokoelman sekvensseistä megablast-algoritmilla (tarkoitettu korkean samankaltaisuuden sekvensseille). Naudan ja lampaan Amel-Y:n lisäksi ainoat kaksi relevanttia (78 ja 83 % homologia, E-arvot 4,10-68 ja 3,10-53) osumaa vastasivat sikojen seitsemännessä kromosomissa olevaa fragmenttia (n. 250 bp), mikä viittaa siihen, että insertio saattaa olla transponoituva elementti.
Tulkitsemme tämän insertion esiintymisen synapomorfiaksi (jaetuksi luonteenpiirteeksi) Cetartiodactyla-heimossa lukuun ottamatta sikoja ja luultavasti muitakin varhaisia johdannaisryhmiä (kameleita, virtahevosia; , ks. kuva 3). Tämän pitkän insertion lisäksi sekvenssikohdistuksessa havaittiin 46 muuta indeliä (sijainnit ja koot tarkemmin kuvassa 5). Indelit ovat erityisen hyödyllisiä testattaessa fylogeneettisiä hypoteeseja, koska ne voivat antaa tietoa pikemminkin muinaisista eroavaisuuksista kuin populaatiotiedoista. Siksi arvioimme, erosivatko fylogeneettiset topologiat toisistaan, jos otimme huomioon näiden indeleiden sisältämän tiedon vai emme. Näin ollen taulukossa 1 tiivistetyt valaiden sekvenssit sekä Artiodactyla-sekvenssit analysoitiin ensinnäkin klassisesti, jolloin aukot koodattiin puuttuviksi merkeiksi, ja toiseksi, jolloin aukot koodattiin täydentäviksi binäärisiksi merkeiksi (ks. kuva 5). Kutakin analyysia varten tehtiin kaksi toisistaan riippumatonta Bayes-hakua. Kuvassa 4 esitetyt fylogeneettiset puut ovat tulosta 20 000 puun konsensuksesta, joka otettiin sen jälkeen, kun standardipoikkeama kahden ajokerran välillä oli laskenut alle 0,01:n. Niissä näkyvät hyvin tuetut solmut. Koko segmentille suoritettu fylogeneettinen analyysi (kuva 4a) vahvisti klusteroitumisen sukupuolikromosomikopion mukaan Cetartiodactyla-heimossa (Stenella cœruleoalba, Balænoptera physalus, Grampus griseus, Tursiops truncatus, Bos taurus ja Ovis aries), kun taas muiden nisäkkäiden Amel-X- ja Amel-Y-heimot klusteroituivat yhdessä muiden nisäkkäiden Amel-X-heimon kanssa Cetartiodactyla-heimon Amel-X-heimon kanssa (Homo sapiens, Sus scrofa). Toisaalta ilman insertion huomioon ottamista johdettu fylogenia antoi toisenlaisen tuloksen (kuva 4b): vaikka haplotyypit klusteroituivat kromosomeittain myös valaiden kohdalla, muissa Cetartiodactyla-heimoissa ei ollut havaittavissa mitään lajihistoriaan tai kromosomikantaan liittyvää signaalia. Näin ollen lajihistoriaan liittyvä fylogeneettinen signaali näyttää vahvistuvan, kun seuraamme puuta Cetartiodactylasta kohti kädellisiä. Tämä fylogeneettisen signaalin osittainen, homoplasiaalinen pysyvyys voi selittyä insertion ympärillä olevan alueen vaikutuksella. Tämä saattaa johtua insertion vanhasta iästä (74-87 myrs ). Myöhemmin tapahtunut homologian häviäminen on saattanut johtaa siihen, että kromosomien välinen evoluutio on joissakin taksoneissa (Cetacea) ollut poikkeavampaa kuin toisissa (Artiodactyla).
Olisikin mielenkiintoista tutkia tätä aluetta koko kladin tasolla yhdistämällä sekvenssi- ja indelimerkit samaan analyysiin. Tämä voisi antaa vihjeitä monien Cetartiodactylan basaalisäteilyä koskevien hypoteesien testaamiseksi (esim. ). Kun otetaan huomioon Suioidean ja Tylopodan oletettavasti basaalinen asema Cetartiodactylan fylogeniassa ( ja kuva 3), oletamme, että insertion edustama merkittävä evoluutiotapahtuma (kuvattu nuolella kuva 4a) tapahtui kerran Cetacea-Ruminantia-klaadissa eikä muissa Cetartiodactyla-klaadeissa.
Tämän suuren insertion esiintyminen Amel-Y-kopiossa voi olla hyödyllistä sukupuolen määrityksessä.
Evoluutiohistoria osoittaa myös, että sukupuolenmääritystekniikkamme soveltuu valaiden lisäksi yli laajaan joukkoon Cetartiodactyla-lajeja, mukaan lukien kotieläinlajit ja luonnonvaraiset lajit, erityisesti laajalle levinneet Ruminantia-lajit (Bovidae, Capridae ja todennäköisesti Cervidae). Se ei kuitenkaan sovellu Suiformes-heimoon, ja lisätutkimuksia tarvitaan sen vahvistamiseksi, että tekniikka ei sovellu myöskään Camelidae-heimoon, kun otetaan huomioon niiden vielä basaalisempi asema Cetartiodactyla-fylogeniassa.
Käyttö sukutaulun arvioinnissa ja populaatiogenetiikassa
Delfiineillä SC1-SC2-aloitinparilla monistetut Amel-Y-fragmentit pystyttiin helposti analysoimaan sekvenssillä ilman kloonaustarvetta, sillä monistaminen oli Y-kromosomille ominaista. Kymmenestä sekvensoidusta raidallisen delfiinin näytteestä yhdeksän oli uroksia, ja pystyimme päättelemään seitsemän erillistä Y-haplotyyppiä (yksi haplotyyppi edusti kolmea yksilöä ja neljä yksittäistä haplotyyppiä), joissa oli 64 polymorfista paikkaa (nukleotidididiversiteetti π = 0,004 ± 0,0007). Näistä puolet oli ~460 bp:n insertiossa. Polymorfisten paikkojen linjaus on esitetty kuvassa 5 (a). On silmiinpistävää, että näissä sekvensseissä oli kaksi hyvin erilaista haploryhmää, jotka erosivat toisistaan keskimäärin 49 substituution verran. Tämä vastaa tuloksiamme, jotka tukevat kahden alalajin todennäköistä olemassaoloa Välimerellä (julkaisemattomat tiedot). Lisäksi toinen näistä haploryhmistä oli erittäin polymorfinen, sillä siinä oli 24 informatiivista paikkaa, kun taas toisissa oli vain kahdeksan. Nämä arvot ovat riittävät käytettäväksi sukutauluanalyyseissä ja populaatiogenetiikassa, koska Y-kromosomi on mitokondriaalisen d-silmukan vastine tässä lajissa. Raidallisen delfiinin sisäinen (ryhmien välinen) eroavuus on suurempi kuin ryhmien välinen eroavuus, sillä raidallisen delfiinin ja suomenvalaan sekvenssien välillä on keskimäärin 45 nukleotidisubstituutiota. Kahta raitadelfiinipopulaatiota verrattaessa on keskimäärin 0,048 ± 0,01 substituutiota paikkaa kohti. Tämä on verrattavissa kummankin populaation ja tavallisen delfiinipopulaation välillä havaittuun eroavuuteen (0,058 ± 0,03) ja vahvistaa, että nukleotidien monimuotoisuus on kertaluokkaa suurempi kuin nisäkkäiden Y-kromosomimerkkien osalta havaittu vaihteluväli (10-4). Mitokondriaalisen d-silmukan osalta monistetun fragmentin koko rajoittaa hieman tekniikan käyttöä. Jotkin hajonneet näytteet eivät monistu; eräs erityisen hajonnut spermavalasnäyte oli silti monistettavissa (tietoja ei ole esitetty).
Koska Y-kromosomipopulaation efektiivisen koon oletetaan olevan pieni, geneettinen ajautuminen vaikuttaa siihen todennäköisemmin. Näin ollen se heijastaa tuoreempia demografisia tapahtumia, kuten pullonkauloja, laajentumisia tai perustajavaikutuksia . Tällaisten tapahtumien tutkimiseksi tarvitaan merkkiaine, jonka monimuotoisuus on riittävän suuri, jotta voidaan rekonstruoida sukutaulut mahdollisimman epäselvästi ja alueilla, joilla rekombinaatio ei häiritse puiden ainutlaatuisuutta. Tätä tarkoitusta varten erittäin vaihtelevat mikrosatelliitit ovat arvokkaita markkereita, mutta ne vaativat intensiivisiä laskentamenetelmiä, jotta voidaan ottaa huomioon epävarmuustekijät puissa, jotka johtuvat alleeleista, jotka ovat identtisiä tilaltaan eivätkä polveutumiseltaan (homoplasiat). Uuden sekvenssimarkkerin lisääminen on sen vuoksi kiinnostavaa Cetartiodactylan Y-kromosomipopulaatiogenetiikan kannalta. Lisäksi Bayesin arvio mutaationopeudesta molempien puiden kussakin reunassa kuvassa 4, joka on laskettu yhdessä fylogeneettisen päättelyn kanssa, osoittaa korkeita arvoja ydin-DNA:n merkkiaineelle: 10-8 ja 10-10 substituutiota paikkaa ja vuotta kohti kaikissa Cetartiodactylan haaroissa. Tämä arvo on nisäkkäiden mitokondriaalisen d-silmukan ja ydin-DNA:n arvojen välimaastossa.
Funktionaaliset näkökulmat amelogeniinin evoluutiossa
Havaitsimme kaksi stop-kodonia eksoni 5:n aminohappoasemista 98 ja 99 kaikissa amelogeniinin Y-kromosomikopioissa neljässä tutkitussa valaslajissa (sekvenssin asemat 988-993, EMBL:AM744959). Amel-Y-geenin tuote voi siis olla typistetty näissä lajeissa tai se voi edustaa pseudogeeniä, kuten on jo havaittu useimpien muiden sarvikuonoklaavien lajeissa
.