Genomic features of A. cerana
Sequencing and assembly
単一コロニーから得られた7頭のドローンにより、アジアミツバチの全ゲノム配列を解明した。 ミツバチは1倍体交配を行うため、雄(ドローン)は1倍体、雌(ワーカーとクイーン)は2倍体である。 細菌やウイルスなどの外来ゲノムからの汚染の可能性を最小限に抑えるため、配列決定前に個々のドローン蜂から中腸の組織を除去した。 ゲノム配列ライブラリーは、イルミナシーケンス技術(152倍カバレッジ)を用いて、短いリード(500 bp)と2つの長いインサートライブラリー(3および10 Kb)の組み合わせで構築した(表2)。 アセンブリは、全長228 Mbの2,430個のスキャフォールドからなり、推定ゲノムサイズ(238 Mb)の96%をカバーしています。 ゲノムアセンブリの一般的な情報を表3に示す。 N50スキャフォールドサイズは1,421 kb(表3)であり、A. melliferaの初期アセンブリおよび最近改良したアセンブリで見られたN50スキャフォールドサイズ(それぞれ359 kbと997 kb、Amel_4.0とAmel_4.5;追加ファイル1:表S1)と比べて非常に長くなっている。 この足場の正確さを評価するために、A. melliferaとA. ceranaのゲノムを比較し、ゲノムのシンテニーを確認した(Additional file 1: Figure S1)。 その結果、セイヨウミドリシジミの第3染色体といくつかのスキャフォールドがシンテニーを示し、大規模な再配置は見られないことがわかった。 また、A. melliferaのミトコンドリアゲノム(NCBI GQ162109, )とA. ceranaの1つのコンティグが約99%という高い配列類似性を有していた(追加ファイル1: Figure S2)。 このコンティグはA. ceranaのミトコンドリアゲノム全体をカバーし、15,915 bpで、13のタンパク質コード遺伝子を含んでいる(Additional file 1: Figure S3)。 すべての配列情報はNCBI .
Guanine plus cytosine (GC) content
The A. Ceranaのゲノムアセンブリの概要は、A. Ceranaのミトコンドリアゲノムの全塩基配列と同じである。 cerana assemblyは30%のGCを含み(表3)、A. melliferaの平均GC含有率(33%)と同様である。 また,6種のアリ(Linepithema humile, Camponotus floridanus, Pogonomyrmex barbatus, Solenopsis invicta, Atta cephalotes, Acromyrmex echinatior)は33%から38%の範囲で同様のGC含量を有していた. 一方、Drosophila melanogaster (42%), Nasonia vitripennis (42%), Harpegnathos saltator (45%) は A. cerana よりも高い GC 含有率を示している。 C. floridanusとH. saltatorの2種のアリの比較研究によると、より複雑な社会的形質を持つ生物はATに偏ったゲノムを持つかもしれない。
相対的ATバイアスはDNAメチル化と相関しており、DNAメチル転移酵素(Dmnts)はほぼ完全に5から3方向にある、グアミンに続くシトシン残基(CpGジヌクレオチド)に標的を定めているためである。 メチルシトシンはチミンに変異しやすいので、CpGジヌクレオチドをTpGジヌクレオチドに変換する変異が段階的に蓄積し、ATリッチゲノムになる。 特に、正規化したCpGの観察値/期待値(CpG o/e)は、DNAメチル化レベルと負の相関がある。 DNAメチル化は、エピジェネティックな制御の主要な部分の一つであり、脊椎動物や昆虫の遺伝子発現制御において機能的な役割を担っている。 脊椎動物のゲノムにはCpGジヌクレオチドが少ないが、A. cerana (1.61), A. mellifera (1.65), C. floridanus (1.58), H. saltator (1.49), N. vitripennis (1.35) などほとんどの♀のゲノムには高いレベルのCpG o/eが存在していることが明らかになった。 もう一つの興味深い発見は、A. ceranaのタンパク質コード配列中のCpG o/e値を正規化すると、A. mellifera (Figure 1, Additional file 1: Figure S4) やエンドウアブラムシのAcyrthosiphon pisumと同様に二峰性の分布が見られることであった。 興味深いことに、低CpG遺伝子は主にハウスキーピング機能に関与し、高CpG遺伝子は発生に関与するという、異なる機能を持つ2つの異なるクラスの遺伝子が存在することが記録されている。 実際、低CpGクラスで表される遺伝子は、代謝過程や転写・翻訳制御に分類されることを見出した。 図1
A. melliferaとA. ceranaのタンパク質配列のCpG解析結果. (A)A. ceranaと(B)A. melliferaの正規化CpG o/e含有量の分布。 ミツバチのタンパク質コード配列の二峰性分布は、ミツバチのゲノムがDNAメチル化の標的となる2つの異なるクラスの遺伝子をコードしていることを示す。 A. cerana、A. mellifera、A. pisumはDNAメチル化タンパク質(Dmnts)を完全にコードしているが、最近の発見によれば、いくつかの昆虫はコーディングエクソンの目立った減少パターンなしにDnmtsのフルセットを保有している。 このことから、このゲノム上の特徴は種特異的ではなく、エピジェネティックな制御のメカニズムはミツバチの両種に保存されている可能性がある。
反復要素
セラナの集合体は6.48% (14.79 Mb) の反復要素を含み、内訳は単純反復3.58% (8.16 Mb) と散在反復 1.95% (4.44 Mb)。 A. cerana特異的な75の繰り返し要素は、de novo繰り返し発見プログラムであるRepeatModeler(バージョン1.0.7)を用いて発見された。 A. ceranaゲノムアセンブリには9.79%のNが含まれているため、今回のアセンブリの反復配列は過小評価されている可能性があると推測された。 A. ceranaでは、A. melliferaと比較して、長鎖末端リピート要素のみが過剰発現しており、ゲノムの0.02% (49.6 kb)に対して、0.1% (218 kb)を占めた。 一方、A. ceranaのゲノムには、long interspersed elementとshort interspersed elementは検出されなかった。 一方、A. melliferaのゲノムでは、long interspersed elementは0.04% (83.1 kb)、short interspersed elementは0.03% (70 kb)の頻度で検出された。 DNAトランスポゾンは、セラカゲノムの0.11% (247 kb)とメリフェラゲノムの0.57% (1.34 Mb)を占めている。 Mariner transposonはミバエで最初に発見されたもので、ミツバチの種を超えて発見されている。 ニホンミツバチのゲノムには、AmMar1からAmMar6までの複数コピーのマリナートランスポゾンが存在した。 一方、セイヨウミツバチゲノムには、AmMar1、AmMar3-6のオルソログが存在したが、AmMar2のオルソログは見つからなかった。 このことは、AmMar1とAmMar2が比較的最近になってA. melliferaゲノムに移されたという推測と一致する。
ゲノム全体のリピート解析はさらに調べる必要があるが、本研究の結果、A. ceranaゲノムではA. melliferaに比べてトランスポゾーン(TEs)とレトロトランスポゾンが著しく減少していることが明らかになった。 TEs の欠如は、他のハチ目昆虫のゲノムと比較して、ミツバチゲノムの大きな特徴の 1 つである。 真社会性生物におけるグルーミングや衛生的な行動が、外来ゲノムからの TE 挿入を減少させることを示唆する証拠もある . しかし、7匹のアリや寄生虫のナゾナゾを含む社会性及び非社会性の♀昆虫ゲノムは配列決定されており、ゲノムの11%から28%を占める繰り返し要素の量は大きく異なっている … そのため、衛生的な行動だけが反復配列の蓄積に影響を与えるわけではないことがわかった。 まず、68 GbのA. cerana RNA-seq readsからde novoアセンブリを行い、515,809,639 bpに及ぶ213,327件の転写産物を生成した。 次に、RNA-seqデータを足場配列にアラインメントし、96,495,948 bpに及ぶ31,027の遺伝子モデルを作成した。 第三に、足場配列情報をもとに計算機による遺伝子予測を行い、18,397,306 bpに及ぶ24,579の遺伝子を生成した。 また、相同性に基づく遺伝子アノテーションを得るために、National Center for Biotechnology Information Reference Sequence Database (NCBI RefSeq, ) から収集した A. mellifera 遺伝子配列をモデルとして使用した。 その後、MAKERプログラムを用いて予測されたすべての遺伝子モデルを統合し、一次遺伝子セットを作成した。 すべての遺伝子は、BLASTXを用いてNCBI non-redundantデータベースと照会した。 最後に、欠損遺伝子、部分遺伝子、分離遺伝子を手作業でチェックした。 味覚受容体(Grs)、嗅覚受容体(Ors)、電位受容体(Irs)を含む化学受容体遺伝子は、機能配列ドメインの解析により、より慎重に調査された。 最終的に、10,651遺伝子がA. ceranaの公式遺伝子セット(OGS)、OGS version 1.0としてアノテーションされ(表4)、そのうち約84%の遺伝子がNCBI non-redundant database、70%がUniprotデータベースでアノテーションされた。 A. cerana OGS v1.0の遺伝子数はA. mellifera OGS v1.0 (10,157 gene)と同程度であった。 しかし、この数は現在公開されているA. melliferaゲノム、OGS v3.2 (15,314 genes; Table 5) よりも少ない。
Gene Ontology (GO) と Kyoto Encyclopedia of Genes and Genomes (KEGG) のデータベースを用いて機能別に遺伝子を分類したところ、6338遺伝子(60%)が複数のGOタームを持ち、1696酵素は125パスウェイに分類された(追加ファイル2、3)。 ここで、ミツバチ特有の分子機構を表すと思われる興味深い分子経路がいくつか明らかになった。 例えば、脂肪酸生合成、グルタチオン代謝、チトクロームP450経路は、巣の仲間の認識や農薬の解毒に関与している可能性がある(Additional file 1: Figure S5) ……。 ミツバチの表面は脂肪酸と炭化水素で構成されており、これらの化合物はアイデンティティを反映し、ガードバチはコロニーのメンバーと侵入者を識別するために認識する . KEGG 解析により、脂肪酸の生合成に関わる酵素のクラスが A. cerana と A. mellifera で共通していること、A. cerana はハエや蚊に比べて解毒酵素が少ないが A. mellifera と同程度の数であることが明らかにされた。 A. melliferaの世界的なコロニー損失に対する農薬の寄与についてはまだ議論の余地があるが、A. melliferaが様々な殺虫剤に異常に敏感であることを示すデータがある 。 興味深いことに、A. ceranaのコロニーはA. melliferaと同様のレベルの崩壊を示していないが、これは、頻繁に逃亡する行動、小さな巣の構造、高地での採餌など、農薬への曝露を減らすことができる他の違いによって説明できるかもしれない。 A. cerana and orthologous to honey bee
A. ceranaの生態の特徴に非相同遺伝子が関連しているかどうかを調べるために、3種類のハチ目昆虫、Apis mellifera(社会性)、Apis cerana(社会性)、Nasonia vitripennis(非社会性)、および1種類のフタ目昆虫、Drosophila melanogaster(非社会性)の正則ベースクラスタリングにより比較した。 A. ceranaの2,182のユニークな遺伝子の中で(図2)、有意に濃縮されたGO用語の多くは、神経筋接合部、神経筋プロセス、筋器官発達の制御、筋細胞分化、筋組織発達に関与していた(p < 0.05, Additional file 4)。 A. ceranaはA. mellifera(235beat/s)に比べて翅の振動数が高く(306beat/s)、素早く、衝動的で、予測不可能な飛行パターンを持つため、筋運動に関わる濃縮タンパク質のいくつかはA. cerana特有の飛行パターンを説明するかもしれない。 図2
昆虫4ゲノムのオルソログ蛋白質群の比較検討。 セラナのタンパク質(オレンジ色の楕円)と、よく知られた3つの昆虫モデル、D. melanogaster(青い楕円)、N. vitripennis(紫の楕円)、A. mellifera(赤い楕円)のオルソロジー解析。 D. melanogasterとN. vitripennisはともに非社会性で、A. melliferaとA. ceranaは社会性の昆虫種である。 *はA. cerana特異的なタンパク質を示す。
特に、化学感覚受容や化学シグナル伝達と密接に関連するニューロン認識、シグナル伝達受容体活性、膜貫通型受容体シグナル伝達経路、電離型グルタミン酸受容体シグナル伝達経路、活性膜貫通輸送体活性などの神経シグナル関連のGO用語も豊富に見られた(p< 0.05)、A. cerana 固有の遺伝子セットに濃縮されていた(Additional file 4)。 特に真社会性生物では、ケミカルシグナルに関わる遺伝子は急速に進化してきた。 ミツバチ社会では、神経シグナル伝達過程が社会的コミュニケーションの媒介として大きな役割を担っている。 A. ceranaはA. melliferaとは異なる集団レベルの行動を多数示し、その中にはスズメバチに対するユニークな防御行動も含まれる。 スズメバチが巣に近づくと、A. cerana の番蜂は腹部を上げ、警戒フェロモンを出しながら揺れ動く。
A. melliferaとA. ceranaは最近分岐したため、両種に保存されたタンパク質のオーソログがあり、ミツバチの特徴を説明できると仮定しました。 その結果、A. ceranaの1,061個のタンパク質がA. melliferaのオルソログと同定されたが、他の非社会性種にはなかった。 これらのオルソログは、社会的コミュニケーションや身体的相互作用に不可欠なGOターム「匂いの感覚」(p < 1.75E-04)および「化学刺激の感覚」(p < 7.55E-04) に分類された。 また、クチクラ炭化水素の検出を表すGO-term “carbohydrate transporter activity” (p < 1.87E-02) や “regulation of short-term neuronal synaptic plasticity” (p < 2.21E-02) や “transmembrane signaling receptor activity” (p < 3.02) が挙げられ、さらに、”synaptic plasticity” (p < 2.21E-02) や “synaptic plasticity” (p < 2.21E-02) も挙げられました。また、社会的相互作用の際の神経細胞シグナル伝達に関与する “regulation neuronal synaptic plastic” (p < 2.21E-02) と “transmbrane signaling receptor activity” (p < 3. 04E-02) は、2種のミツバチに共通するオルソログに富むことがわかった(追加ファイル 1: Table S3)。
ケモレセプター遺伝子ファミリー
コミュニケーションや社会行動で大切な役割を果たす化学受容器は、一部、巣仲間からの化学シグナルを感知して仲介している . 化学受容体の主な遺伝子群には、味覚受容体(Grs)、嗅覚受容体(Ors)、電位受容体(Irs)があります。 アリやミツバチのような社会性昆虫では、化学的コミュニケーションはコロニーの維持や協力に極めて重要である。 我々は、A. ceranaのゲノムから10種類のGrs、119種類のOrs、そして10種類のIrsを新たに同定した。 RNA-seqデータを用いて遺伝子発現パターンを調べたところ、注釈付きの化学受容体遺伝子はよく整理されており、A. melliferaやN. vitripennisと同等であるが、A. melliferaゲノムと比べるとやや少ないことがわかった。
Gustatory receptor family
Gustatory receptor familyは、味に重要な役割を果たし、エネルギーや子守りのために蜜と花粉を集めるために使用されている … ミツバチの社会では、コロニーのメンバーは分業しており、さまざまな仕事をこなしています。 看護バチは、ブルードと女王の世話をし、彼らは巣の中をきれいにする。 採集蜂は外から食物や樹脂を採集し、巣に持ち込む。 この行動変遷にはGr遺伝子発現の末梢的・内部的制御が関与している。
RobertsonとWannerによると、西洋ミツバチA. melliferaは13Grを持つ(H. M. Robertson, personal communication)、ミバエ D. melanogaster (68 Grs, )、蚊 Aedes aegypti (79 Grs, )、寄生蜂 N. vitripennis (58 Grs, )、蟻 Linepithema humile (116 Grs, )に比べると少ない数である。 A. ceranaのゲノムには、A. melliferaと同様に10個のGr遺伝子が同定された。 これらの遺伝子は、A. melliferaのGrs(AmGrs)との相同性に基づいて命名された。 また、AcGr1, 2, 3, 6, 7, 9, 10はN. vitripennisのGrsとオルソログを有していた(Additional file 1: Figure S6)。 これらのデータから、Gr遺伝子は雌雄同体で高度に保存されていることが示された。 また,AcGr1とAcGr2はA. melanogasterの糖受容体(DmGr5a,DmGr61a,DmGr64a/f)に対して拡張した系譜に位置している(図3A). また、AcGr3は、ショウジョウバエの末梢でフルクトース受容体として、脳で栄養センサーとして機能するDmGr43aとクレードを共有していた (図3A)。 一方、AcGr6, 7, 9, 10, および X 系統は DmGrs と明らかな関係を示さず、ミツバチに固有である可能性が示唆された。 このことは、苦味受容体が保存されているアリなどの他の社会性昆虫と比較して、ミツバチが花を好むようになったことと関係があるのかもしれない。 さらに、ショウジョウバエの二酸化炭素(CO2)受容体のオルソログであるGr21aおよびGr63aは、A. melliferaと同様、セラナゲノムには存在しなかった。 しかし、ミツバチは二酸化炭素を感知することが知られており、ショウジョウバエに見られる酸感知機構と同様に、高濃度の二酸化炭素を感知する新しい分子機構を進化させた可能性が示唆された 。 A. ceranaのGr4とGr5の部分配列はTBLASTN検索で見つけられた。 図3
味覚受容体(Gr)ファミリーの系統樹(図3)。 (A) A. cerana(赤)、A. mellifera(青)、D. melanogasterの味覚受容体タンパク質を用いて構築した系統樹 (B) A. cerana(左)、A. mellfera(右)のRPKM値による相対的Gr遺伝子発現プロファイリング。 赤色は青色と比較して高発現を示す。
相対遺伝子発現解析により、A. ceranaとA. melliferにおけるGrオルソログの発現パターンを決定した(図3B)。 意外なことに、2 種のミツバチの間の Gr のオルソログの発現パターンは異なっていた。 糖受容体候補であるGr1およびGr2は、A. ceranaではA. melliferaに比べて高発現しており(図3B)、A. ceranaは糖を感知する能力がより高い可能性が示唆された。 同様に、Gr5とGr7もA. ceranaではA. melliferaと比較して高発現であった。 一方、Gr3, 6, 9, 10 は A. cerana と比較して A. mellifera でより高発現していた。 このことは、Gr4とGrXが検出されないレベル、あるいは舌や脚などの他の組織で発現している可能性を示唆している。 今後、Grsの機能的な研究により、種間の味覚認識や内部調節の違いが明らかになるかもしれない。
匂い物質受容体ファミリー
昆虫の匂い物質受容体は、環境信号認識や種間・種内コミュニケーションに重要な役割を果たす。 ミツバチは親族認識、食物ナビゲーション、フェロモン検出などの文脈で臭気物質受容体を利用している。 しかし、匂い物質受容体の重要性にもかかわらず、ハエや蚊などの他のモデル昆虫と比較して、ミツバチのOrsの機能的同定は不十分である。
A. ceranaゲノムにおいて、匂い物質受容体ドメインを含む少数の5分あるいは3分の部分配列を含む119のAcOrsが同定された。 我々はA. ceranaのOrsを足場における配列の位置で命名した。 ほとんどのAcOrはスキャフォールドに均一に広がっておらず、ゲノムの数カ所に集まっていた。 例えば、37個のOrs、15個のOrs、17個のOrsのクラスターがそれぞれscaffold 3、103、139に配列していた(Additional file 1: Figure S7)。 A. melliferaでは、2番染色体上に60個のOrsの最大タンデム配列が見られた。 このことは、隣接する遺伝子による不均等なクロスオーバーが起こったことを示唆している。 Orパラログの多さは、フェロモンブレンド、クチクラ炭化水素、花の匂いカクテルなど、ミツバチ社会における匂い物質認識の役割が多様であることを示している。 A. melliferaとA. ceranaは最近分岐したため、Orクラスター間にシンテニーが存在する可能性があると考えられた。 A. ceranaゲノムとA. melliferaゲノムのOr遺伝子配置を比較することにより、A. mellifera第2染色体のマイクロシンテニー保存領域が同定された。 このことから、ミツバチのOrパラログは保存されたゲノム領域に集まっていることが示唆された(図4C、Additional file 5)。
免疫関連遺伝子
ミツバチは社会防衛力学や個々の分子・行動防衛機構を研究する上で貴重なモデルとなっている。 A. mellifera とは対照的に、A. cerana は、ハチの病原体の主要なベクターの 1 つである外部寄生ダニ Varroa destructor に対して感受性がない。 一方、A. cerana は近年、ウイルスや細菌による疾病に大きな被害を受けている。 最近の報告では、韓国において、アジアのミツバチのコロニーの 90% 以上が嚢虫ウイルス (SBV) 感染により崩壊したことが示されている。 また、多くのアジア諸国でもいくつかの理由でセラナのコロニーが減少している。 しかし、ミツバチがどのような分子的防御機構を持っているかはまだ分かっていない。 そこで、他の昆虫ゲノムと比較することにより、セラカゲノムに存在する免疫遺伝子を調べた。
複数のTBLASTN検索により、160の免疫遺伝子オルソログがセラで同定され、さらに11遺伝子がマニュアルアノテーションにより検出された。 また、Toll経路、Imd経路、Jak/Stat経路、JNK経路など、主要な経路が全て同定された。 特に、Imd経路の構成要素であるFADD、Dredd、KennyとToll経路のPelleは、A. ceranaゲノムからは検出されなかった(図6)。 A. ceranaの自然免疫遺伝子の総数は、他の社会性ハチ目昆虫と同様であり(Additional file 1: Table S4)、A. ceranaのほとんどの免疫遺伝子は、他の配列決定済みの昆虫種と比較してA. melliferaと高い配列類似性を共有していた。 これは、A. ceranaとA. melliferaの間で自然免疫系が保存されているためであると考えられる。 真社会性昆虫は、清掃行動(衛生行動、グルーミング、引き受け)、熱防御(A. melliferaはこの行動がない)、抗生物質の巣の構造(樹脂の収集)など、社会的免疫システムがあり、病原体への曝露を減らすことに貢献していると考えられる。