Amelogenina pode ser usada para sexagem molecular e genética evolutiva em Cetartiodactyla
Amplificação do segmento estudado do locus da amelogenina usando os primers específicos da espécie SC1-SC2 resultou em um óbvio polimorfismo de tamanho relacionado ao sexo em todos os Cetacea (Fig. 1) com uma banda única de 521 bp para as fêmeas (duas cópias Amel-X) e uma banda adicional de 980 bp para o Amel-Y nos machos. Este padrão era óbvio nas baleias Baleia-baleia macho (Mysticetes) mas não houve amplificação Amel-X correspondente nos golfinhos machos a menos que se utilizassem os iniciadores X5-X6 derivados da sequência de amelogenina humana. Estudos anteriores mostraram que a amplificação da amelogenina era propensa à desistência alélica ou pelo menos à amplificação preferencial. Estes fenómenos podem ser explicados por vários factores. Normalmente, a amplificação do alelo de menor tamanho é favorecida quando a quantidade de polimerase é um fator limitante ou em caso de degradação do DNA modelo. Pequenas quantidades de DNA também podem aumentar a estocasticidade do recozimento . Contudo, os nossos resultados não são consistentes com estas situações, uma vez que o alelo favorecido (Amel-Y) é sempre o maior. Por outro lado, diferenças no conteúdo de GC e desencontros nas sequências de recozimento podem ser responsáveis pela amplificação diferencial. Os fragmentos de amelogenina que estudamos são caracterizados por um maior conteúdo de GC quando amplificados a partir do cromossomo X (56%) do que a partir do cromossomo Y (47%). Esta diferença pode resultar de uma não-inserção no fragmento Amel-X. Esta característica, bem como um desfasamento de 2 bp-long entre o Amel-X do golfinho e o final de 5′ do iniciador inverso SC2 (Fig. 2) pode favorecer a amplificação preferencial da cópia Y nos golfinhos (Fig. 1b). De facto, a amplificação das amostras de golfinhos machos SC3 (primer sem incompatibilidade, ver Fig. 2) em vez do SC2, restaura as duas bandas, vistas nas baleias de barbas. A presença desta grande inserção na cópia Amel-Y pode ser usada para determinação do sexo em provavelmente todas as espécies de cetáceos.
Para definir os pontos de quebra do local de inserção em Y e investigar a sua história evolutiva, sequenciámos vários cetáceos (listados em Métodos; sequências depositadas sob as seguintes adesões: EMBL:AM744958 a AM744971). Após alinhamento com as sequências disponíveis do Artiodactyla (ver lista em Métodos), detectamos o mesmo polimorfismo em todos os outros Cetartiodactyla excepto o Porco (Fig. 3): uma inserção 460-465 bp (tamanho é uma função dos indels dentro de diferentes indivíduos ou espécies) localizada entre a 4ª e 5ª exons (188ª a 651ª posição das sequências Y, por exemplo, EMBL:AM744958). Os nomes dos haplótipos e as suas respectivas entradas são apresentados na Tabela 1. A semelhança da sequência foi verificada executando BLAST (Basic Local Alignment Search Tool) sobre sequências de recolha de nucleótidos GenBank nr/nt com algoritmo de megablast (destinado a sequências de elevada semelhança). Além do Amel-Y bovino e ovino, os únicos dois relevantes (78 e 83% homologia, valores E 4,10-68 e 3,10-53) acertaram um fragmento no sétimo cromossomo em suínos (ca. 250 bp), sugerindo que a inserção poderia ser um elemento transponível.
Interpretamos a presença desta inserção como uma sinapomorfia (caráter compartilhado) do Cetartiodáctilo excluindo porcos e provavelmente outros grupos precoces derivados (camelos, hipopótamos; , ver Fig. 3). Além desta inserção longa, 46 outros indels foram detectados por alinhamento de sequência (posições e tamanhos detalhados na Figura 5). Os indels são particularmente úteis para testar hipóteses filogénicas, uma vez que podem fornecer informação sobre divergências antigas em vez de informação populacional. Portanto, avaliamos se as topologias filogenéticas diferem se levamos em conta ou não a informação contida nestes indels. Assim, as sequências de cetáceos resumidas na Tabela 1, bem como as sequências de Artiodactyla, foram analisadas em primeiro lugar de forma clássica, com lacunas codificadas como caracteres em falta, e em segundo lugar, com lacunas codificadas como caracteres binários suplementares (ver Fig. 5). Para cada análise, foram realizadas duas buscas Bayesianas independentes. As árvores filogenéticas apresentadas na Figura 4 resultam de um consenso de 20.000 árvores amostradas após um desvio padrão entre as duas séries caiu abaixo de 0,01. Elas mostram nós altamente suportados. A análise filogenética realizada no segmento completo (Fig. 4a) confirmou o agrupamento por cópia de cromossomos sexuais em Cetartiodactyla (Stenella cœruleoalba, Balænoptera physalus, Grampus griseus, Tursiops truncatus, Bos taurus e Ovis aries) enquanto Amel-X e Amel-Y agruparam-se em outros mamíferos (Homo sapiens, Sus scrofa) juntamente com Amel-X de Cetartiodactyla. Por outro lado, a filogenia inferida sem levar em conta a inserção deu um resultado diferente (Fig. 4b): enquanto os haplótipos também se agruparam por cromossomas em cetáceos, nenhum sinal relacionado tanto com a história da espécie como com o comportamento cromossómico pôde ser visto nos outros Cetartiodáctilos. Assim, o sinal filogenético relacionado com a história da espécie parece fortalecer-se à medida que seguimos a árvore de Cetartiodactyla em direcção aos primatas. Esta persistência parcial, homoplásica, do sinal filogenético pode ser explicada pela influência da região que circunda a inserção. Isto pode ser o resultado da velhice da inserção (74-87 myrs ). A subsequente perda da homologia pode ter dado origem a uma evolução mais divergente entre cromossomos em alguns taxa (Cetacea) do que em outros (Artiodactyla).
Seria interessante estudar esta região ao nível de toda a clade, combinando caracteres de sequência e indel na mesma análise. Isto poderia dar pistas para testar as muitas hipóteses sobre a radiação basal de Cetartiodactyla (por exemplo). Dada a presumível posição basal da Suioidea e Tylopoda na filogenia de Cetartiodactyla ( e Fig. 3), supomos que o maior evento evolutivo representado pela inserção (ilustrado por uma seta Figura 4a) ocorreu uma vez no clade Cetacea-Ruminantia e não no restante Cetartiodactyla.
A presença desta grande inserção na cópia Amel-Y pode ser útil para a determinação do sexo.
A história evolutiva também indica que a nossa técnica de sexagem é aplicável, para além dos cetáceos, a uma vasta gama de espécies de Cetartiodactyla incluindo espécies domésticas e selvagens, em particular os Ruminantia (Bovidae, Capridae e muito provavelmente Cervidae). No entanto não é adequado para Suiformes e são necessários mais estudos para confirmar que a técnica também não é aplicável aos Camelidae, dada a sua posição ainda mais basal na filogenia de Cetartiodactyla.
Usar na avaliação do pedigree e genética da população
Nos golfinhos, os fragmentos de Amel-Y amplificados com o par de primers SC1-SC2 foram facilmente sequenciados sem necessidade de clonagem, uma vez que a amplificação foi específica do cromossoma Y. Das dez amostras de golfinhos listrados sequenciadas, nove eram machos, e pudemos deduzir sete haplótipos em Y distintos (um haplótipo representado por três indivíduos e quatro haplótipos individuais) com 64 sítios polimórficos (diversidade de nucleótidos π = 0,004 ± 0,0007). Metade destes estavam na inserção de ~460 bp. Um alinhamento dos sítios polimórficos é apresentado na Figura 5 (a). De forma impressionante, estas seqüências mostraram dois grupos de haplogrupos altamente divergentes, divergindo por uma média de 49 substituições. Isto concorre com os nossos resultados que suportam a provável existência de duas subespécies dentro do mar Mediterrâneo (dados não publicados). Além disso, um destes haplogrupos mostrou um elevado grau de polimorfismo, com 24 locais informativos, enquanto os outros mostraram apenas oito. Estes valores são suficientes para uso na análise de pedigree e genética populacional, como o homólogo do cromossoma Y do d-loop mitocondrial nesta espécie. De facto, no golfinho listrado a divergência intra-específica (intergrupos) é maior do que a divergência interespecífica com uma média de 45 substituições de nucleótidos entre as sequências de golfinho listrado e de baleia. Existe uma média de 0,048 ± 0,01 substituições por local quando se comparam as duas populações de golfinhos estriados. Isto é comparável à divergência observada entre cada população e o golfinho-comum (0,058 ± 0,03) e confirma que a diversidade de nucleótidos é uma ordem de grandeza superior à amplitude observada (10-4) para os marcadores cromossómicos Y nos mamíferos. Quanto ao d-loop mitocondrial, o tamanho do fragmento amplificado limita ligeiramente a utilização da técnica. Algumas amostras degradadas não amplificam; mesmo assim, uma amostra de cachalote particularmente degradada ainda era amplificável (dados não mostrados).
Desde que se espera que a população de cromossomas Y tenha um pequeno tamanho efectivo, é mais provável que seja afectada pela deriva genética. Assim, ela reflete eventos demográficos mais recentes, como gargalos, expansões ou efeitos fundadores . Para estudar este tipo de evento, é necessário um marcador cuja diversidade seja suficientemente alta para permitir a reconstrução de genealogias com as menores ambiguidades e em regiões onde a recombinação não interfere com a singularidade das árvores. Para isso, microsatélites altamente variáveis representam marcadores valiosos, mas requerem métodos computacionais intensivos para levar em conta as incertezas nas árvores decorrentes de alelos que são idênticos por estado e não por descendência (homoplasias). A adição de um novo marcador de sequência é, portanto, de interesse para a genética da população de cromossomas Y em Cetartiodáctila. Além disso, a estimativa Bayesiana da taxa de mutação em cada borda de ambas as árvores na Fig. 4, calculada conjuntamente com a inferência filogenética, mostra valores elevados para um marcador de DNA nuclear: entre 10-8 e 10-10 substituições por local e por ano em todos os ramos de Cetartiodactyla. Este valor é intermediário entre os do d-loop mitocondrial e o DNA nuclear em mamíferos .
Perspectivas funcionais na evolução da amelogenina
Encontramos dois códons de parada nas posições de aminoácidos 98 e 99 do exon 5 em todas as cópias cromossômicas Y de amelogenina nas quatro espécies de cetáceos estudadas (posições 988-993 da seqüência EMBL:AM744959). O produto do gene Amel-Y pode portanto ser truncado nestas espécies ou representar um pseudogene como já observado em espécies da maioria das outras clades euterianas