La amelogenina puede utilizarse para el sexado molecular y la genética evolutiva en Cetartiodactyla
La amplificación del segmento estudiado del locus de la amelogenina utilizando los cebadores SC1-SC2 específicos para cada especie dio como resultado un polimorfismo de tamaño evidente relacionado con el sexo en todos los Cetacea (Fig. 1) con una banda única de 521 pb para las hembras (dos copias de Amel-X) y una banda adicional de 980 pb para la Amel-Y en los machos. Este patrón era obvio en los machos de ballenas barbadas (Mysticetes), pero no había una amplificación correspondiente de Amel-X en los delfines machos, a menos que se utilizaran los cebadores X5-X6 derivados de la secuencia de amelogenina humana. Estudios anteriores mostraron que la amplificación de la amelogenina era propensa al abandono alélico o al menos a la amplificación preferencial. Estos fenómenos pueden explicarse por varios factores. Por lo general, la amplificación del alelo de menor tamaño se ve favorecida cuando la cantidad de polimerasa es un factor limitante o en caso de degradación del ADN molde. Las pequeñas cantidades de ADN también pueden aumentar la estocasticidad del recocido. Sin embargo, nuestros resultados no coinciden con estas situaciones, ya que el alelo favorecido (Amel-Y) es siempre el mayor. Por otro lado, las diferencias en el contenido de GC y los desajustes en las secuencias de recocido pueden explicar la amplificación diferencial. Los fragmentos de amelogenina que hemos estudiado se caracterizan por un mayor contenido de GC cuando se amplifican a partir del cromosoma X (56%) que a partir del cromosoma Y (47%). Esta diferencia puede ser el resultado de una no inserción en el fragmento Amel-X. Esta característica, así como un desajuste de 2 pb entre el Amel-X del delfín y el extremo 5′ del cebador inverso SC2 (Fig. 2) puede favorecer la amplificación preferencial de la copia Y en los delfines (Fig. 1b). En efecto, la amplificación de las muestras de delfines macho SC3 (cebador sin desajuste, véase la Fig. 2) en lugar del SC2, restablece las dos bandas, observadas en las ballenas barbadas. La presencia de esta gran inserción en la copia de Amel-Y puede ser utilizada para la determinación del sexo en probablemente todas las especies de cetáceos.
Para definir los puntos de ruptura de la localización de la inserción Y e investigar su historia evolutiva, secuenciamos varios cetáceos (listados en Métodos; secuencias depositadas bajo las siguientes accesiones: EMBL:AM744958 a AM744971). Tras el alineamiento con las secuencias disponibles de Artiodactyla (véase la lista en Métodos), detectamos el mismo polimorfismo en todos los demás Cetartiodactyla excepto en el Cerdo (Fig. 3): una inserción de 460-465 pb (el tamaño está en función de los indels dentro de los diferentes individuos o especies) localizada entre los exones 4º y 5º (posición 188ª a 651ª de las secuencias Y, por ejemplo, EMBL:AM744958). Los nombres de los haplotipos y sus correspondientes accesiones figuran en la Tabla 1. La similitud de las secuencias se comprobó ejecutando BLAST (Basic Local Alignment Search Tool) sobre las secuencias de la colección de nucleótidos nr/nt del GenBank con el algoritmo megablast (destinado a las secuencias de alta similitud). Además del Amel-Y bovino y ovino, los dos únicos resultados relevantes (78 y 83% de homología, valores E 4,10-68 y 3,10-53) coincidían con un fragmento del séptimo cromosoma de los cerdos (aprox. 250 pb), lo que sugiere que la inserción podría ser un elemento transponible.
Interpretamos la presencia de esta inserción como una sinapomorfía (carácter compartido) de los Cetartiodactyla excluyendo a los cerdos y probablemente a otros grupos derivados tempranos (camellos, hipopótamos; , ver Fig. 3). Además de esta larga inserción, se detectaron otros 46 indels mediante la alineación de la secuencia (las posiciones y los tamaños se detallan en la Figura 5). Los indels son particularmente útiles para comprobar las hipótesis filogénicas, ya que pueden proporcionar información sobre antiguas divergencias en lugar de información poblacional. Por lo tanto, evaluamos si las topologías filogenéticas diferían si teníamos en cuenta o no la información contenida en estos indels. Así, las secuencias de cetáceos resumidas en la Tabla 1, así como las secuencias de Artiodactyla, fueron analizadas primero de forma clásica, con huecos codificados como caracteres perdidos, y segundo, con huecos codificados como caracteres binarios suplementarios (ver Fig. 5). Para cada análisis, se realizaron dos búsquedas bayesianas independientes. Los árboles filogenéticos presentados en la Figura 4 son el resultado de un consenso de 20.000 árboles muestreados después de que la desviación estándar entre las dos ejecuciones fuera inferior a 0,01. Muestran nodos altamente apoyados. El análisis filogenético realizado en el segmento completo (Fig. 4a) confirmó la agrupación por copia del cromosoma sexual en Cetartiodactyla (Stenella cœruleoalba, Balænoptera physalus, Grampus griseus, Tursiops truncatus, Bos taurus y Ovis aries) mientras que Amel-X y Amel-Y se agruparon en otros mamíferos (Homo sapiens, Sus scrofa) junto con Amel-X de Cetartiodactyla. Por otro lado, la filogenia inferida sin tener en cuenta la inserción dio un resultado diferente (Fig. 4b): mientras que los haplotipos también se agruparon por cromosoma en los cetáceos, no se pudo ver ninguna señal relacionada ni con la historia de la especie ni con el porte cromosómico en los otros Cetartiodactyla. Por tanto, la señal filogenética relacionada con la historia de las especies parece reforzarse a medida que seguimos el árbol desde los Cetartiodactyla hacia los primates. Esta persistencia parcial, homoplásica, de la señal filogenética puede explicarse por la influencia de la región que rodea la inserción. Esto podría ser el resultado de la antigüedad de la inserción (74-87 myrs ). La posterior pérdida de homología puede haber dado lugar a una evolución más divergente entre los cromosomas en algunos taxones (Cetacea) que en otros (Artiodactyla).
Sería interesante estudiar esta región a nivel de todo el clado combinando los caracteres de secuencia y de indel en el mismo análisis. Esto podría dar pistas para probar las numerosas hipótesis sobre la radiación basal de Cetartiodactyla (por ejemplo). Dada la posición presumiblemente basal de los Suioidea y Tylopoda en la filogenia de los Cetartiodactyla ( y la Fig. 3), nuestra hipótesis es que el principal evento evolutivo representado por la inserción (ilustrado por una flecha en la Figura 4a) ocurrió una vez en el clado Cetacea-Ruminantia y no en el resto de los Cetartiodactyla.
La presencia de esta gran inserción en la copia Amel-Y puede ser útil para la determinación del sexo.
La historia evolutiva también indica que nuestra técnica de sexado es aplicable, además de a los cetáceos, a una amplia gama de especies de Cetartiodactyla, incluyendo especies domésticas y salvajes, en particular a los extendidos Ruminantia (Bovidae, Capridae y muy probablemente Cervidae). Sin embargo, no es adecuado para los Suiformes y se requieren más estudios para confirmar que la técnica tampoco es aplicable a los Camelidae, dada su posición aún más basal en la filogenia de los Cetartiodactyla.
Uso en la evaluación del pedigrí y la genética de la población
En los delfines, los fragmentos Amel-Y amplificados con el par de cebadores SC1-SC2 fueron fácilmente secuenciados sin necesidad de clonación ya que la amplificación fue específica del cromosoma Y. De las diez muestras de delfín listado secuenciadas, nueve eran machos, y pudimos deducir siete haplotipos Y distintos (un haplotipo representado por tres individuos y cuatro haplotipos individuales) con 64 sitios polimórficos (diversidad de nucleótidos π = 0,004 ± 0,0007). La mitad de ellos se encontraban en la inserción de ~460 pb. En la figura 5 (a) se presenta un alineamiento de los sitios polimórficos. Llamativamente, estas secuencias mostraron dos haplogrupos altamente divergentes, con una media de 49 sustituciones. Esto coincide con nuestros resultados, que apoyan la probable existencia de dos subespecies en el Mediterráneo (datos no publicados). Además, uno de estos haplogrupos mostró un alto grado de polimorfismo, con 24 sitios informativos, mientras que los otros sólo mostraron ocho. Estos valores son suficientes para su uso en el análisis del pedigrí y la genética de poblaciones, ya que el cromosoma Y es la contrapartida del bucle d mitocondrial en esta especie. En efecto, en el delfín listado la divergencia intraespecífica (intergrupal) es mayor que la divergencia interespecífica, con una media de 45 sustituciones de nucleótidos entre las secuencias del delfín listado y del rorcual común. Hay una media de 0,048 ± 0,01 sustituciones por sitio cuando se comparan las dos poblaciones de delfines listados. Esto es comparable a la divergencia observada entre cada población y el delfín común (0,058 ± 0,03) y confirma que la diversidad de nucleótidos es un orden de magnitud superior al rango observado (10-4) para los marcadores del cromosoma Y en los mamíferos . En cuanto al bucle d mitocondrial, el tamaño del fragmento amplificado limita ligeramente el uso de la técnica. Algunas muestras degradadas no se amplifican; aun así, una muestra de cachalote particularmente degradada era todavía amplificable (datos no mostrados).
Dado que se espera que la población del cromosoma Y tenga un tamaño efectivo pequeño, es más probable que se vea afectada por la deriva genética. Por lo tanto, refleja eventos demográficos más recientes como cuellos de botella, expansiones o efectos fundadores . Para estudiar este tipo de eventos, se necesita un marcador cuya diversidad sea lo suficientemente alta como para permitir la reconstrucción de genealogías con las menores ambigüedades y en regiones donde la recombinación no interfiera con la unicidad de los árboles. Para ello, los microsatélites altamente variables representan marcadores valiosos, pero requieren métodos de cálculo intensivos para tener en cuenta las incertidumbres en los árboles que surgen de los alelos que son idénticos por estado y no por descendencia (homoplasias) . Por lo tanto, la adición de un nuevo marcador de secuencia es interesante para la genética de poblaciones del cromosoma Y en Cetartiodactyla. Además, la estimación bayesiana de la tasa de mutación en cada borde de ambos árboles en la Fig. 4, calculada conjuntamente con la inferencia filogenética, muestra valores elevados para un marcador de ADN nuclear: entre 10-8 y 10-10 sustituciones por sitio y por año en todas las ramas de Cetartiodactyla. Este valor es intermedio entre los del bucle d mitocondrial y el ADN nuclear de los mamíferos.
Perspectivas funcionales en la evolución de la amelogenina
Encontramos dos codones de parada en las posiciones aminoácidas 98 y 99 del exón 5 en todas las copias del cromosoma Y de la amelogenina en las cuatro especies de cetáceos estudiadas (posiciones 988-993 de la secuencia EMBL:AM744959). Por lo tanto, el producto del gen Amel-Y puede estar truncado en estas especies o representar un pseudogén, como ya se ha observado en especies de la mayoría de los otros clados de euterios
.