Características genómicas de A. cerana
Sequenciação e montagem
Realizámos a sequência genómica completa da abelha melífera asiática usando sete zângãos derivados de uma única colónia. Como a abelha melífera tem um sistema de acasalamento haplodiplóide, os machos (zângãos) são haplóides e as fêmeas (operárias e rainhas) são diplóides. Para minimizar a possível contaminação por genomas estranhos, como bactérias e vírus, eliminamos os tecidos do meio do intestino das abelhas zangões individuais antes da sequenciação. As bibliotecas de sequência genómica foram construídas com uma combinação de leituras curtas (500 bp) e duas bibliotecas de inserção mais longas (3 e 10 Kb), utilizando a tecnologia de sequenciação Illumina (cobertura 152 vezes) (Tabela 2). A montagem consistiu de 2.430 andaimes com um comprimento total de 228 Mb, que cobriram 96% do tamanho estimado do genoma (238 Mb) . Informações gerais sobre a montagem do genoma são apresentadas na Tabela 3. O tamanho do andaime N50 era de 1.421 kb (Tabela 3), muito maior do que o tamanho do andaime N50 encontrado nas montagens iniciais e recentemente melhoradas de A. mellifera (359 kb e 997 kb, Amel_4.0 e Amel_4.5, respectivamente; arquivo adicional 1: Tabela S1) . Para avaliar a precisão dos andaimes, nós comparamos o genoma de A. mellifera e A. cerana para identificar a síntese genômica (Arquivo adicional 1: Figura S1). Os resultados revelaram vários andaimes de A. cerana e do cromossoma 3 de A. mellifera que mostraram relações sintéticas sem rearranjo em larga escala. Além disso, descobrimos que o genoma mitocondrial de A. mellifera (NCBI GQ162109, ) e um contigente de A. cerana tinha alta semelhança de seqüência, ~99% (Arquivo adicional 1: Figura S2). Este contigente, abrangendo todo o genoma A. cerana mitocondrial, é 15.915 bp e inclui 13 genes codificadores de proteínas (Ficheiro adicional 1: Figura S3). Todas as informações da seqüência foram submetidas no NCBI .
Guanina mais conteúdo de citosina (GC)
O A. cerana assembly contém 30% de GC (Tabela 3), semelhante ao conteúdo médio de GC de A. mellifera (33%). Além disso, seis espécies de formiga (Linepithema humile, Camponotus floridanus, Pogonomyrmex barbatus, Solenopsis invicta, Atta cephalotes e Acromyrmex echinatior) possuem teores de GC semelhantes, variando de 33% a 38% . Em contraste, Drosophila melanogaster (42%), Nasonia vitripennis (42%) e Harpegnathos saltator (45%) têm teores de GC mais elevados em comparação com A. cerana. Segundo estudos comparativos de duas espécies de formigas, C. floridanus e H. saltator, organismos com traços sociais mais complexos podem ter genomas AT-biased .
Relative AT bias correlative com a metilação do DNA, uma vez que as metiltransferases de DNA (Dmnts) são quase inteiramente direcionadas a resíduos de citosina seguidos por guaninas na orientação 5′ a 3′ (CpG dinucleotides). A metilcitosina tende a sofrer uma mutação para a timina (T), pelo que a acumulação gradacional de mutação que converte os dinucleótidos CpG em dinucleótidos TpG leva a genomas ricos em AT. Em particular, os valores normalizados de CpG observados/esperados (CpG o/e) têm uma relação negativa com os níveis de metilação do ADN . A metilação do ADN é uma das partes principais da regulação epigenética e tem papéis funcionais na regulação da expressão genética em vertebrados e insectos . Em contraste com os genomas dos vertebrados, que estão esgotados de dinucleotídeos CpG , a maioria dos insetos himenópteros, incluindo A. cerana (1,61), A. mellifera (1,65), C. floridanus (1,58), H. saltator (1,49) e N. vitripennis (1,35), exibem altos níveis de CpG o/e em seus genomas . Outra descoberta intrigante é que o valor normalizado de CpG o/e dentro das seqüências de codificação de proteínas de A. cerana mostrou distribuição bimodal, similar a A. mellifera (Figura 1, arquivo adicional 1: Figura S4) e o pulgão de ervilha Acyrthosiphon pisum. Curiosamente, duas classes distintas de genes estão documentadas para desempenhar diferentes funções, as quais os genes de CpG baixo estão principalmente envolvidos na função doméstica e os genes de CpG alto estão envolvidos no desenvolvimento. De fato, descobrimos que genes que são representados por classes de baixo-CpG são categorizados com processo metabólico, e regulação transcripcional e translacional. Em contraste, genes com alto-CpG representaram categorias GO específicas para funções biológicas.
>
O genoma de A. cerana, A. mellifera e A. pisum codificam complementos completos de proteínas de metilação de DNA (Dmnts) , mas, de acordo com uma descoberta recente, vários insetos possuem um conjunto completo de Dnmts sem qualquer padrão de codificação de exons de depleção marcante. Assim, esta característica genómica pode não ser específica da espécie, mas mecanismos de regulação epigenética podem ser conservados em ambas as espécies de abelhas.
Elementos repetitivos
O conjunto de A. cerana compreende 6,48% (14,79 Mb) elementos repetitivos, consistindo de 3,58% (8,16 Mb) repetições simples e 1,95% (4,44 Mb) repetições intercaladas (Ficheiro adicional 1: Tabela S2). Setenta e cinco elementos de repetição específicos de A. cerana foram encontrados usando o programa de novo repeat find, RepeatModeler (versão 1.0.7). Como a montagem do genoma A. cerana contém 9,79% N’s, nós assumimos que seqüências repetitivas na montagem atual podem ser subestimadas. Em comparação com A. mellifera, apenas elementos de repetição terminal longa foram sobre-representados em A. cerana, que representou 0,1% (218 kb) do genoma, comparado a 0,02% (49,6 kb) em A. mellifera. Em contraste, elementos longos intercalados e elementos curtos intercalados não foram detectados no genoma de A. cerana. Ambos foram encontrados no genoma de A. mellifera em frequências de 0,04% (83,1 kb) e 0,03% (70 kb), respectivamente. Os transpositores de DNA constituem 0,11% (247 kb) do genoma A. cerana e 0,57% (1,34 Mb) do genoma A. mellifera. Elementos transponíveis pela primeira vez descobertos na mosca-das-frutas, foram encontrados através das espécies de abelhas melíferas. O genoma da abelha-melífera ocidental, A. mellifera, continha múltiplas cópias de transpositores mariner, variando de AmMar1 a AmMar6. Em contraste, o genoma A. cerana continha ortologs de AmMar1 e AmMar3-6, mas o ortolog AmMar2 não foi encontrado. Isto é consistente com a especulação de que AmMar1 e AmMar2 foram transferidos para o genoma A. mellifera relativamente recentemente .
Embora análises repetidas em todo o genoma precisem ser investigadas mais a fundo, os resultados deste estudo mostraram uma redução marcante de elementos transponíveis (TEs) e retrotransposões no genoma A. cerana em comparação com A. mellifera. A falta de ET é uma das principais características do genoma das abelhas, em comparação com outros Hymenoptera sequenciados. Algumas evidências sugerem que o aliciamento e comportamentos higiênicos em organismos eusociais reduziram a inserção de ETs de genomas estrangeiros . No entanto, tanto os genomas sociais como não sociais dos hímenópteros, incluindo sete formigas e o parasitoide Nasonia, foram sequenciados, e incluem quantidades significativamente diferentes de elementos repetitivos, compreendendo 11% a 28% dos genomas. Portanto, o comportamento higiênico não é o único fator influenciando a acumulação de elementos repetitivos nos genomas.
Análise do conjunto A. ceranagene
Devido a dados limitados sobre os tags de seqüência expressa (ESTs) e DNAs complementares (cDNAs) disponíveis para A. cerana, nós estabelecemos um pipeline de anotação gênica usando dados de múltiplas evidências (Tabela 4). Primeiro, geramos 213.327 transcrições cobrindo 515.809.639 bp usando um conjunto de novo de 68 Gb de leitura RNA-seq de A. cerana. Segundo, os dados do RNA-seq foram alinhados com seqüências de andaimes, o que resultou em 31.027 modelos de genes representando 96.495.948 bp. Terceiro, realizamos a previsão computacional dos genes com base nas informações da seqüência do andaime, que gerou 24.579 genes cobrindo 18.397.306 bp. Também empregamos sequências de genes A. mellifera coletadas do National Center for Biotechnology Information Reference Sequence Database (NCBI RefSeq, ) como modelo para obter a anotação de genes baseada em homologia. Posteriormente, fundimos todos os modelos de genes previstos usando o programa MAKER para gerar um conjunto de genes primários. Todos os genes foram consultados com a base de dados NCBI não redundante utilizando o BLASTX. Finalmente, verificamos manualmente a ausência de genes, genes parciais, ou genes separados. Os genes quimiorreceptores, incluindo receptores gustativos (Grs), receptores odoríferos (Ors) e receptores ionotrópicos (Irs), foram investigados mais cuidadosamente usando análises de domínios de sequências funcionais. Finalmente, 10.651 genes foram anotados como o conjunto de genes oficial (OGS) de A. cerana, OGS versão 1.0 (Tabela 4), dos quais aproximadamente 84% dos genes foram anotados com a base de dados NCBI não redundante e 70% foram anotados na base de dados Uniprot . No total, o número total de genes no OGS A. cerana v1.0 foi comparável ao número no OGS A. mellifera v1.0 (10.157 genes). Entretanto, o número é menor que a atual liberação do genoma A. mellifera, OGS v3.2 (15.314 genes; Tabela 5) .
Classificamos genes por função usando a ontologia gênica (GO) e a Enciclopédia de Genes e Genomas de Kyoto (KEGG); 6.338 genes (60%) tinham mais de um termo GO e 1.696 enzimas foram categorizadas em 125 vias (Arquivos adicionais 2 e 3). Aqui foram reveladas várias vias moleculares interessantes que poderiam representar mecanismos moleculares específicos das abelhas. Por exemplo, a biossíntese do ácido graxo, o metabolismo do glutatião e as vias do citocromo P450 podem estar envolvidos no reconhecimento e desintoxicação de pesticidas (arquivo adicional 1: Figura S5) . A superfície da abelha é composta por ácidos gordos e hidrocarbonetos, que reflectem a identidade, e as abelhas de guarda reconhecem estes compostos para discriminar os membros da colónia dos intrusos . As análises do KEGG revelaram que classes de enzimas envolvidas na biossíntese de ácidos graxos são partilhadas entre A. cerana e A. mellifera, e A. cerana tem menos enzimas de desintoxicação em comparação com a mosca e o mosquito, mas números semelhantes a A. mellifera. A contribuição de pesticidas para as perdas globais de colônia de A. mellifera ainda é uma questão controversa, mas os dados indicam que A. mellifera é invulgarmente sensível a vários inseticidas . Curiosamente, as colônias de A. cerana não mostraram níveis semelhantes de colapso a A. mellifera, mas isto poderia ser explicado por outras diferenças que podem reduzir a exposição a pesticidas, tais como comportamento de fuga frequente, arquitetura de ninhos pequenos, e forrageamento em regiões de alta altitude .
Genes exclusivos de A. mellifera. ceranaand orthologous to honey bee
Para investigar se os genes não ortogonais estão associados a características da biologia de A. cerana, comparamos três insetos himenópteros, Apis mellifera (social), Apis cerana (social), Nasonia vitripennis (não social) e um inseto dipterano, Drosophila melanogaster (não social) por agrupamento baseado em ortologia. Entre 2.182 genes únicos em A. cerana (Figura 2), a maioria dos GO-terms significativamente enriquecidos estavam envolvidos na junção neuromuscular, processo neuromuscular, regulação do desenvolvimento dos órgãos musculares, diferenciação das células musculares e desenvolvimento do tecido muscular (p < 0,05, arquivo adicional 4). A. cerana tem uma freqüência maior de batimentos das asas (306 batimentos/s) comparado com A. mellifera (235 batimentos/s) e padrões de vôo rápidos, impetuosos e imprevisíveis, portanto algumas das proteínas enriquecidas envolvidas no movimento muscular podem ser responsáveis por padrões de vôo específicos de A. cerana. Estudos futuros devem ser realizados para dissecar esta relação.
Notavelmente, GO-terms relacionados à sinalização neural, incluindo reconhecimento de neurônio, atividade do receptor de sinalização, via de sinalização do receptor transmembrana, via de sinalização do receptor de glutamato ionotrópico e atividade ativa do transportador transmembrana, que estão intimamente relacionados com a recepção quimiosensorial e sinalização química, também foram enriquecidos (p < 0.05) no conjunto genético único de A. cerana (arquivo adicional 4). Os genes envolvidos na sinalização química evoluíram rapidamente, especialmente em organismos eusociais . Os processos de sinalização neural desempenham papéis importantes como mediadores da comunicação social na sociedade das abelhas melíferas. A. cerana mostra uma série de comportamentos a nível de grupo distintos de A. mellifera, incluindo um comportamento de defesa único contra uma vespa. A. as abelhas de guarda do cerana levantam os abdómens e agitam ou agitam, produzindo feromonas de alarme, quando os vespões se aproximam da colmeia. É necessária uma pesquisa adicional para determinar se os mecanismos de regulação molecular encontrados exclusivamente em A. cerana podem ser responsáveis por estes comportamentos únicos de defesa social.
Desde que A. mellifera e A. cerana divergiram recentemente, nós colocamos a hipótese de que haveria ortologs proteicos conservados em ambas as espécies de abelhas melíferas que explicam as características comuns das abelhas melíferas. Um total de 1.061 proteínas de A. cerana foram identificadas com ortologs em A. mellifera, mas nenhuma outra espécie não social. Estes ortologs foram categorizados com GO-terms “percepção sensorial do olfato” (p < 1,75E-04) e “percepção sensorial do estímulo químico” (p < 7,55E-04), que são características cruciais para a comunicação social e interação física . Além disso, o termo GO “atividade transportadora de carboidratos” (p < 1.87E-02), que descreve a detecção de hidrocarbonetos cuticulares, e “regulação da plasticidade sináptica neuronal de curto prazo” (p < 2.21E-02) e “atividade receptora de sinalização transmembrana” (p < 3.04E-02), que estão envolvidos na sinalização neuronal durante a interação social, também foram enriquecidos em ortologs compartilhados pelas duas espécies de abelhas (arquivo adicional 1: Tabela S3).
Família genética quimiorreceptora
Os quimiorreceptores desempenham papéis importantes na comunicação e nos comportamentos sociais, em parte por mediarem a detecção de sinais químicos dos ninhos. Os principais grupos de genes quimiorreceptores incluem receptores gustativos (Grs), receptores odoríferos (Ors) e receptores ionotrópicos (Irs) . Em insetos sociais, como formigas e abelhas, a comunicação química é crucial para a manutenção e cooperação das colônias. Aqui, temos caracterizado 10 novos Grs, 119 novos Ors e 10 novos Irs no genoma A. cerana. Os padrões de expressão gênica, examinados usando dados do RNA-seq, revelaram que os genes quimiorreceptores anotados estavam bem organizados e comparáveis aos de A. mellifera e N. vitripennis, embora estivessem ligeiramente sub-representados em comparação com o genoma A. mellifera .
A família de receptores gustativos
A família de receptores gustativos tem um papel importante no sabor e é usada para coletar néctar e pólen para energia e cuidados de criação . Na sociedade das abelhas, os membros da colónia têm trabalho de divisão e realizam diferentes tarefas. As abelhas enfermeiras cuidam da criação e da rainha, e limpam dentro do ninho. As abelhas forrageiras recolhem os alimentos ou resina do exterior e trazem-nos para a colmeia. A regulação periférica e interna da expressão do gene Gr está envolvida nesta transição comportamental .
De acordo com Robertson e Wanner , a abelha-melífera ocidental, A. mellifera tem 13 Grs (H. M. Robertson, comunicação pessoal), um pequeno número comparado com a mosca da fruta D. melanogaster (68 Grs, ), o mosquito Aedes aegypti (79 Grs, ), a vespa parasitoide N. vitripennis (58 Grs, ), e a formiga Linepithema humilde (116 Grs, ). Semelhante ao A. mellifera, foram identificados 10 genes Gr no genoma A. cerana. Eles foram nomeados com base em sua ortologia para A. mellifera Grs (AmGrs). Todos os Grs identificados em A. cerana mostraram relações ortológicas simples com Grs em A. mellifera, e AcGr1, 2, 3, 6, 7, 9, e 10 também tinham ortologs em N. vitripennis (arquivo adicional 1: Figura S6). Estes dados indicaram que os genes Gr são altamente conservados entre as espécies de himenópteros. Similar ao repertório A. mellifera Gr, AcGr1 e AcGr2 foram posicionados em linhagens expandidas para receptores de açúcar de D. melanogaster, incluindo DmGr5a, DmGr61a e DmGr64a/f (Figura 3A) . Além disso, AcGr3 compartilhou um clade com DmGr43a, que funciona como um receptor de frutose na periferia e um sensor de nutrientes no cérebro de Drosophila (Figura 3A) . Em contraste, AcGr6, 7, 9, 10 e X linhagens não mostraram relações aparentes com DmGrs, implicando que elas podem ser únicas para a abelha melífera. Os receptores de sabor amargo também parecem estar perdidos no genoma A. cerana, o que pode estar relacionado com a evolução da preferência floral da abelha melífera em comparação com outros insetos sociais, como a formiga, na qual os receptores amargos são preservados. Além disso, ortologs para receptores de dióxido de carbono (CO2) de Drosophila, Gr21a e Gr63a, não estavam presentes no genoma A. cerana, semelhante ao A. mellifera. No entanto, sabe-se que as abelhas são capazes de detectar CO2, indicando que podem ter desenvolvido novos mecanismos moleculares semelhantes ao mecanismo de detecção de ácidos encontrado em Drosophila para detectar altas concentrações de CO2 . Seqüências parciais de ortologs A. cerana Gr4 e Gr5 foram localizadas usando pesquisas com TBLASTN. Um ortograma Gr8 não pôde ser encontrado no genoma A. cerana.
Padrões de expressão dos ortologs de Gr em A. cerana e A. mellifera foram determinados por análises de expressão gênica relativa (Figura 3B). Surpreendentemente, os padrões de expressão dos ortologs Gr entre as duas espécies de abelhas melíferas foram distintos. Os receptores de açúcar candidatos, Gr1 e Gr2, foram expressos mais alto em A. cerana em comparação com A. mellifera (Figura 3B), sugerindo que A. cerana pode ter uma maior capacidade de sentir açúcares. Da mesma forma, Gr5 e Gr7 foram altamente expressos em A. cerana comparado com A. mellifera. Em contraste, Gr3, 6, 9, e 10 foram mais altamente expressos em A. mellifera comparado com A. cerana. Gr4 e GrX não foram detectados na transcrição antennal de A. cerana (dados não mostrados), implicando que Gr4 e GrX poderiam ser expressos em níveis indetectáveis ou em outros tecidos, como a língua ou pernas. Futuros estudos funcionais sobre Grs podem revelar diferenças de sensibilidade gustativa e regulação interna entre as espécies.
A família de receptores odoríferos
Os receptores odoríferos dos insetos desempenham papéis importantes no reconhecimento do sinal ambiental e na comunicação entre e intra-espécies. As abelhas melíferas utilizam os receptores odoríferos em contextos, incluindo o reconhecimento de parentes, navegação por alimentos e detecção de feromonas . No entanto, apesar da importância dos receptores odoríferos, a identificação funcional de Ors nas abelhas melíferas é inexistente em comparação com outros modelos de insetos, incluindo espécies de moscas e mosquitos .
No genoma A. cerana, 119 AcOrs, incluindo algumas 5′- ou 3′- seqüências parciais contendo o domínio dos receptores odoríferos, foram identificadas. Nomeámos A. cerana Ors por posições de sequência em andaimes. A maioria dos AcOrs não estavam espalhados uniformemente pelos andaimes, mas estavam agrupados em alguns locais do genoma. Por exemplo, clusters de 37 Ors, 15 Ors, e 17 Ors foram agrupados nos andaimes 3, 103, e 139, respectivamente (arquivo adicional 1: Figura S7). Em A. mellifera, a maior matriz tandem de 60 Ors foi encontrada no cromossomo 2 . Esta expansão de Ors implica um cruzamento desigual por genes vizinhos. O grande número de Parálogos Or indicam diversos papéis para o reconhecimento do odor na sociedade das abelhas, tais como misturas de feromonas, hidrocarbonetos cuticulares e coquetéis de odor floral . Uma vez que A. mellifera e A. cerana divergiram recentemente, foi levantada a hipótese de que pode haver sintonia entre Or clusters. Regiões do cromossomo A. mellifera 2 com conservação do microssinteto foram identificadas através da comparação do arranjo do gene Or no genoma A. cerana com o genoma A. mellifera. Consistente com a hipótese, foram encontrados microsynteny conservados e ortologs claros de A. cerana Ors para A. mellifera Ors (Figura 4C, Arquivo adicional 5), sugerindo que abelha de mel ou parálogos estão agrupados em regiões genômicas conservadas.