Uma inserção altamente polimórfica no gene da amelogenina do cromossoma Y pode ser usada para biologia evolutiva, genética populacional e sexagem em Cetacea e Artiodactyla

Amelogenina pode ser usada para sexagem molecular e genética evolutiva em Cetartiodactyla

Amplificação do segmento estudado do locus da amelogenina usando os primers específicos da espécie SC1-SC2 resultou em um óbvio polimorfismo de tamanho relacionado ao sexo em todos os Cetacea (Fig. 1) com uma banda única de 521 bp para as fêmeas (duas cópias Amel-X) e uma banda adicional de 980 bp para o Amel-Y nos machos. Este padrão era óbvio nas baleias Baleia-baleia macho (Mysticetes) mas não houve amplificação Amel-X correspondente nos golfinhos machos a menos que se utilizassem os iniciadores X5-X6 derivados da sequência de amelogenina humana. Estudos anteriores mostraram que a amplificação da amelogenina era propensa à desistência alélica ou pelo menos à amplificação preferencial. Estes fenómenos podem ser explicados por vários factores. Normalmente, a amplificação do alelo de menor tamanho é favorecida quando a quantidade de polimerase é um fator limitante ou em caso de degradação do DNA modelo. Pequenas quantidades de DNA também podem aumentar a estocasticidade do recozimento . Contudo, os nossos resultados não são consistentes com estas situações, uma vez que o alelo favorecido (Amel-Y) é sempre o maior. Por outro lado, diferenças no conteúdo de GC e desencontros nas sequências de recozimento podem ser responsáveis pela amplificação diferencial. Os fragmentos de amelogenina que estudamos são caracterizados por um maior conteúdo de GC quando amplificados a partir do cromossomo X (56%) do que a partir do cromossomo Y (47%). Esta diferença pode resultar de uma não-inserção no fragmento Amel-X. Esta característica, bem como um desfasamento de 2 bp-long entre o Amel-X do golfinho e o final de 5′ do iniciador inverso SC2 (Fig. 2) pode favorecer a amplificação preferencial da cópia Y nos golfinhos (Fig. 1b). De facto, a amplificação das amostras de golfinhos machos SC3 (primer sem incompatibilidade, ver Fig. 2) em vez do SC2, restaura as duas bandas, vistas nas baleias de barbas. A presença desta grande inserção na cópia Amel-Y pode ser usada para determinação do sexo em provavelmente todas as espécies de cetáceos.

Figure 1

Polimorfismo de fragmento de amelogenina relacionado com o sexo em cetáceos. (Os marcadores de peso molecular são Biolabs’ 1 kb + escada): a) Gel de agarose mostrando diferenças entre a amplificação masculina numa baleia Baleia (desdentada) (à esquerda da escada) e nas baleias dentadas (à direita). b) Gel de agarose mostrando diferenças entre machos e fêmeas no golfinho listrado. Faixa de 1.000 bp para Amel-Y, faixa de 500 bp para Amel-X. Cada faixa representa uma única amostra (#1 a 5). Símbolos ♂ e ♀ são para amostras de machos e fêmeas respectivamente.

>Figure 2

Alinhamento sequencial dos primers oligonucleotídeos com sequências alvo em Cetacea , Gado e Homem. Espécies e localização cromossômica são dadas no lado direito. As colunas sombreadas representam o nucleotídeo mutado nos Golfinhos. Seguem-se os números das sequências de adesão: Golfinhos (EMBL:AM744958-AM744964, EMBL:AM744970-AM744971, EMBL:AM744968, EMBL:AY787743S2 – Y e EMBL:AM744965 – X) e Baleias (EMBL:AM744967, EMBL:AM744969 -X- e EMBL:AM744966 – Y), Gado (GenBank:AB091789 -X- e GenBank:AB091790 – Y) e Homem (GenBank:NT_011757 -X- de 9098117 a 9098612 e GenBank:NC_000024 -Y- de 6796200 a 6796719).

Para definir os pontos de quebra do local de inserção em Y e investigar a sua história evolutiva, sequenciámos vários cetáceos (listados em Métodos; sequências depositadas sob as seguintes adesões: EMBL:AM744958 a AM744971). Após alinhamento com as sequências disponíveis do Artiodactyla (ver lista em Métodos), detectamos o mesmo polimorfismo em todos os outros Cetartiodactyla excepto o Porco (Fig. 3): uma inserção 460-465 bp (tamanho é uma função dos indels dentro de diferentes indivíduos ou espécies) localizada entre a 4ª e 5ª exons (188ª a 651ª posição das sequências Y, por exemplo, EMBL:AM744958). Os nomes dos haplótipos e as suas respectivas entradas são apresentados na Tabela 1. A semelhança da sequência foi verificada executando BLAST (Basic Local Alignment Search Tool) sobre sequências de recolha de nucleótidos GenBank nr/nt com algoritmo de megablast (destinado a sequências de elevada semelhança). Além do Amel-Y bovino e ovino, os únicos dois relevantes (78 e 83% homologia, valores E 4,10-68 e 3,10-53) acertaram um fragmento no sétimo cromossomo em suínos (ca. 250 bp), sugerindo que a inserção poderia ser um elemento transponível.

Tabela 1 Lista de nomes dos haplótipos Amel-X e Amel-Y em cetáceos e seus números de adesão ao EMBL
Figure 3

Representação esquemática do polimorfismo relacionado ao sexo do locus amelogenin numa perspectiva evolutiva. A inserção e o intron 4 são representados por uma barra branca, enquanto que o exon 5 é em preto. Barras sombreadas significam dados ausentes, deduzidos de relações evolucionárias. A ordem vertical se liga à visão “árvore da vida” (segundo outros) fornecida à direita.

Interpretamos a presença desta inserção como uma sinapomorfia (caráter compartilhado) do Cetartiodáctilo excluindo porcos e provavelmente outros grupos precoces derivados (camelos, hipopótamos; , ver Fig. 3). Além desta inserção longa, 46 outros indels foram detectados por alinhamento de sequência (posições e tamanhos detalhados na Figura 5). Os indels são particularmente úteis para testar hipóteses filogénicas, uma vez que podem fornecer informação sobre divergências antigas em vez de informação populacional. Portanto, avaliamos se as topologias filogenéticas diferem se levamos em conta ou não a informação contida nestes indels. Assim, as sequências de cetáceos resumidas na Tabela 1, bem como as sequências de Artiodactyla, foram analisadas em primeiro lugar de forma clássica, com lacunas codificadas como caracteres em falta, e em segundo lugar, com lacunas codificadas como caracteres binários suplementares (ver Fig. 5). Para cada análise, foram realizadas duas buscas Bayesianas independentes. As árvores filogenéticas apresentadas na Figura 4 resultam de um consenso de 20.000 árvores amostradas após um desvio padrão entre as duas séries caiu abaixo de 0,01. Elas mostram nós altamente suportados. A análise filogenética realizada no segmento completo (Fig. 4a) confirmou o agrupamento por cópia de cromossomos sexuais em Cetartiodactyla (Stenella cœruleoalba, Balænoptera physalus, Grampus griseus, Tursiops truncatus, Bos taurus e Ovis aries) enquanto Amel-X e Amel-Y agruparam-se em outros mamíferos (Homo sapiens, Sus scrofa) juntamente com Amel-X de Cetartiodactyla. Por outro lado, a filogenia inferida sem levar em conta a inserção deu um resultado diferente (Fig. 4b): enquanto os haplótipos também se agruparam por cromossomas em cetáceos, nenhum sinal relacionado tanto com a história da espécie como com o comportamento cromossómico pôde ser visto nos outros Cetartiodáctilos. Assim, o sinal filogenético relacionado com a história da espécie parece fortalecer-se à medida que seguimos a árvore de Cetartiodactyla em direcção aos primatas. Esta persistência parcial, homoplásica, do sinal filogenético pode ser explicada pela influência da região que circunda a inserção. Isto pode ser o resultado da velhice da inserção (74-87 myrs ). A subsequente perda da homologia pode ter dado origem a uma evolução mais divergente entre cromossomos em alguns taxa (Cetacea) do que em outros (Artiodactyla).

Figure 4

Comparação das árvores filogenéticas dos fragmentos de Amel-X e Amel-Y inferidos (a) com a inserção (b) sem a inserção. (a) A árvore filogenética do fragmento completo mostra agrupamento transespecífico por cromossoma sexual em Cetartiodactyla. As etiquetas de dica são haplotipos como depositados na base de dados EMBL; Y e X são para haplotipos Amel-Y e Amel-X respectivamente. Os haplótipos de Stenella cœruleoalba foram nomeados de acordo com a origem da população (YA/Grupo 1, YB/Grupo 2, ver Métodos). (b) A filogenia inferida após a remoção da inserção dá um quadro ligeiramente diferente: o agrupamento transespecífico por cromossoma sexual é perdido, exceto nos cetáceos.

Figure 5

Polymorphic sites and indels in the Amel-X and Amel-Y regions in the Cetacean species studied. (a) As posições dos nucleotídeos estão representadas acima e no lado esquerdo os nomes dos haplótipos. Todas as posições são representadas na primeira sequência e cada nucleotídeo correspondente nos outros haplótipos é representado por um ponto. (b) Os indels são numerados (primeira linha) seguindo sua ordem nas seqüências alinhadas. Eles são caracterizados por sua posição (segunda linha) e seu comprimento (terceira linha). Em ambas as tabelas, as áreas sombreadas correspondem à região que contém a grande inserção.

Seria interessante estudar esta região ao nível de toda a clade, combinando caracteres de sequência e indel na mesma análise. Isto poderia dar pistas para testar as muitas hipóteses sobre a radiação basal de Cetartiodactyla (por exemplo). Dada a presumível posição basal da Suioidea e Tylopoda na filogenia de Cetartiodactyla ( e Fig. 3), supomos que o maior evento evolutivo representado pela inserção (ilustrado por uma seta Figura 4a) ocorreu uma vez no clade Cetacea-Ruminantia e não no restante Cetartiodactyla.

A presença desta grande inserção na cópia Amel-Y pode ser útil para a determinação do sexo.

A história evolutiva também indica que a nossa técnica de sexagem é aplicável, para além dos cetáceos, a uma vasta gama de espécies de Cetartiodactyla incluindo espécies domésticas e selvagens, em particular os Ruminantia (Bovidae, Capridae e muito provavelmente Cervidae). No entanto não é adequado para Suiformes e são necessários mais estudos para confirmar que a técnica também não é aplicável aos Camelidae, dada a sua posição ainda mais basal na filogenia de Cetartiodactyla.

Usar na avaliação do pedigree e genética da população

Nos golfinhos, os fragmentos de Amel-Y amplificados com o par de primers SC1-SC2 foram facilmente sequenciados sem necessidade de clonagem, uma vez que a amplificação foi específica do cromossoma Y. Das dez amostras de golfinhos listrados sequenciadas, nove eram machos, e pudemos deduzir sete haplótipos em Y distintos (um haplótipo representado por três indivíduos e quatro haplótipos individuais) com 64 sítios polimórficos (diversidade de nucleótidos π = 0,004 ± 0,0007). Metade destes estavam na inserção de ~460 bp. Um alinhamento dos sítios polimórficos é apresentado na Figura 5 (a). De forma impressionante, estas seqüências mostraram dois grupos de haplogrupos altamente divergentes, divergindo por uma média de 49 substituições. Isto concorre com os nossos resultados que suportam a provável existência de duas subespécies dentro do mar Mediterrâneo (dados não publicados). Além disso, um destes haplogrupos mostrou um elevado grau de polimorfismo, com 24 locais informativos, enquanto os outros mostraram apenas oito. Estes valores são suficientes para uso na análise de pedigree e genética populacional, como o homólogo do cromossoma Y do d-loop mitocondrial nesta espécie. De facto, no golfinho listrado a divergência intra-específica (intergrupos) é maior do que a divergência interespecífica com uma média de 45 substituições de nucleótidos entre as sequências de golfinho listrado e de baleia. Existe uma média de 0,048 ± 0,01 substituições por local quando se comparam as duas populações de golfinhos estriados. Isto é comparável à divergência observada entre cada população e o golfinho-comum (0,058 ± 0,03) e confirma que a diversidade de nucleótidos é uma ordem de grandeza superior à amplitude observada (10-4) para os marcadores cromossómicos Y nos mamíferos. Quanto ao d-loop mitocondrial, o tamanho do fragmento amplificado limita ligeiramente a utilização da técnica. Algumas amostras degradadas não amplificam; mesmo assim, uma amostra de cachalote particularmente degradada ainda era amplificável (dados não mostrados).

Desde que se espera que a população de cromossomas Y tenha um pequeno tamanho efectivo, é mais provável que seja afectada pela deriva genética. Assim, ela reflete eventos demográficos mais recentes, como gargalos, expansões ou efeitos fundadores . Para estudar este tipo de evento, é necessário um marcador cuja diversidade seja suficientemente alta para permitir a reconstrução de genealogias com as menores ambiguidades e em regiões onde a recombinação não interfere com a singularidade das árvores. Para isso, microsatélites altamente variáveis representam marcadores valiosos, mas requerem métodos computacionais intensivos para levar em conta as incertezas nas árvores decorrentes de alelos que são idênticos por estado e não por descendência (homoplasias). A adição de um novo marcador de sequência é, portanto, de interesse para a genética da população de cromossomas Y em Cetartiodáctila. Além disso, a estimativa Bayesiana da taxa de mutação em cada borda de ambas as árvores na Fig. 4, calculada conjuntamente com a inferência filogenética, mostra valores elevados para um marcador de DNA nuclear: entre 10-8 e 10-10 substituições por local e por ano em todos os ramos de Cetartiodactyla. Este valor é intermediário entre os do d-loop mitocondrial e o DNA nuclear em mamíferos .

Perspectivas funcionais na evolução da amelogenina

Encontramos dois códons de parada nas posições de aminoácidos 98 e 99 do exon 5 em todas as cópias cromossômicas Y de amelogenina nas quatro espécies de cetáceos estudadas (posições 988-993 da seqüência EMBL:AM744959). O produto do gene Amel-Y pode portanto ser truncado nestas espécies ou representar um pseudogene como já observado em espécies da maioria das outras clades euterianas

Deixe um comentário