Séquençage et assemblage GS-FLX et GS-FLXTM de Roche
Six passages de séquençage ont donné une taille totale de données de ≈910 Mb équivalente à 2 913 966 lectures brutes. Les fichiers de séquences brutes sont disponibles auprès de la NCBI Sequence Read Archive (SRA) à l’adresse http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?study=SRP006173, en tant que fichiers SRR172675 (S1), SRR172676 et SRR183482 (S2), SRR172677 (S3), SRR172678 et SRR183483 (S4), SRR172679 (S5) et SRR172680 (S6). La distribution de la fréquence des longueurs des lectures brutes s’est regroupée autour des plages de 200 à 300 pb et de 300 à 400 pb en raison de l’utilisation de deux plateformes différentes pour le séquençage (figure 1A). Un total de 2 700 168 reads (93% du total) est entré dans le processus d’assemblage qui a donné 21 207 séquences assemblées de haute qualité (20 408 isotigs + 799 contigs¸ équivalent à 87% des reads entrant dans l’assemblage et ≈82% de toutes les séquences assemblées). Celles-ci avaient une longueur comprise entre 80 et 3 379 pb (figure 1B) et une longueur de séquence moyenne de 1 014 pb (isotigs) et 930 pb (contigs). Un total de 178 636 lectures (≈6 % du total) sont restées sous forme de singletons (profondeur de couverture = 1) ; parmi celles-ci, seules 5 113 séquences propres sont restées après le contrôle de qualité. Les isolements ont ensuite été incorporés dans 15 667 isogroupes. Un résumé d’état du processus de séquençage, d’assemblage et d’annotation (voir ci-dessous) est présenté dans le tableau 1.
Annotation of A. hypochondriacus contigs/isotigs
Tous les contigs/isotigs ont été interrogés contre les bases de données nr, TAIR, UniRef100, UniRef50 et Amaranthaceae ESTs et PFAM pour annotation. Environ 82 % de toutes les entrées ont produit des résultats significatifs (E ≤ 1 × 10-10) lors de l’interrogation de la base de données nr (tableau 1). Les 3 901 séquences sans résultat significatif par rapport à la base de données nr ont été interrogées par rapport à la base de données des domaines protéiques PFAM afin de déterminer leur fonction putative. Seule une petite fraction de ces séquences (≈2%) a produit des hits significatifs (valeurs E ≤ 1 × 10-5) avec des domaines protéiques connus. Ces résultats sont disponibles dans le fichier additionnel 1. L’annotation des 5 113 singletons propres par rapport à la base de données TAIR a donné environ 1 000 occurrences significatives.
La meilleure occurrence pour chaque unigène interrogé par rapport à la base de données TAIR a été utilisée pour attribuer une annotation GO fonctionnelle en termes de groupes de processus biologiques (11 224 séquences), de fonctions moléculaires (11 499 séquences) et de composants cellulaires (11 227 séquences). Les résultats sont résumés dans la figure 2. Comme prévu, le plus grand pourcentage dans chaque groupe GO (12% à 15%) était constitué de contigs/isotigs avec une annotation fonctionnelle inconnue. Aucune différence évidente dans le nombre de séquences assignées à chaque catégorie, y compris la réponse au stress (a)biotique, n’a été observée entre l’amarante des grains et Arabidopsis thaliana. Cela reflète probablement la capacité connue d’Arabidopsis à répondre fortement aux stress abiotiques et biotiques au niveau transcriptionnel. Ce résultat va également à l’encontre de la possibilité que l’amarante des grains possède une signature transcriptomique différente, en particulier dans les catégories du stress et de la réponse aux stimuli, qui pourrait expliquer sa tolérance caractéristique au stress (a)biotique, contrairement à ce qui a été observé chez les espèces végétales adaptées aux habitats extrêmes (par exemple l’halophyte Thellungiella halophila, apparentée à Arabidopsis, et les mangroves extrêmophiles). Ainsi, l’affectation fonctionnelle GO pour le processus biologique (Figure 2A) a indiqué que 3 % des contigs/isotigs étaient regroupés dans la réponse au stress/stimuli, 2 % dans les processus de développement et 4 % supplémentaires dans d’autres processus biologiques et métaboliques. Ces catégories présentaient un intérêt particulier pour nous, étant donné que l’un des principaux objectifs de cette étude du transcriptome était de fournir des informations permettant d’identifier les gènes répondant au stress (a)biotique (voir ci-dessous). Parmi le nombre de transcrits auxquels un rôle de défense a été attribué (1% du total), plus de la moitié étaient associés à l’infection bactérienne (41%) et à la régulation de l’acide jasmonique (JA) (24%), y compris de nombreux gènes de biosynthèse du JA (par ex. LOX13, AOS, AOC, OPR3) et des gènes sensibles au JA (Figure 3A ; voir également les fichiers supplémentaires 2, 3 et 4).
La perspective globale obtenue à partir des informations ci-dessus est que l’amarante des grains possède un arsenal diversifié de gènes pour résister à l’infection par des agents pathogènes et à l’herbivorie des insectes, dont la majorité est signalée pour la première fois chez cette espèce. Ces gènes comprennent des gènes potentiellement impliqués dans la synthèse de l’oxalate et des phytoecdystéroïdes (résultats non montrés), qui sont considérés comme des armes défensives efficaces chez l’amarante et d’autres espèces . La mise en œuvre d’une réponse de défense relativement robuste était quelque peu inattendue, au moins contre l’herbivorie des insectes, considérant que la tolérance exceptionnellement élevée à la défoliation que nous avons observée chez les plantes A. hypochondriacus (voir ci-dessous), pourrait être censée exempter cette espèce d’un investissement dans des réponses de défense inductibles métaboliquement coûteuses (par exemple les inhibiteurs de protéase et les lectines). La nature des gènes de résistance aux agents pathogènes isolés était également complexe, et comprenait toute une gamme de protéines bactériennes et fongiques induites par les éliciteurs et liées à la pathogenèse, des récepteurs extracellulaires similaires à ceux impliqués dans les réponses de défense induites par les éliciteurs, des protéases, des facteurs de transcription (TF) et des enzymes impliquées dans la génération-détoxification des espèces réactives de l’oxygène.
Aussi importants de notre point de vue étaient les gènes potentiellement impliqués dans la photosynthèse compensatoire, la relocalisation des hydrates de carbone (tableau 2) et la régulation/synthèse des niveaux de phytohormones (figure 3B), peut-être liés à l’augmentation de la ramification observée chez les plantes d’amarante des grains en réponse à la défoliation causée par l’herbivorie des insectes et/ou les dommages mécaniques . Plusieurs des gènes identifiés peuvent être utilisés pour étudier des processus non liés. Par exemple, l’analyse des gènes liés aux phytohormones, en combinaison avec ceux montrant une homologie avec les gènes de la floraison est poursuivie pour avoir une idée des mécanismes génétiques responsables de plusieurs symptômes produits par l’infection par le phytoplasme de l’amarante des grains au champ, y compris la phyllodie .
Comparaison transcriptomique entre A. hypochondriacus et A. tuberculatus
Les données transcriptomiques brutes 454 pyroséquençage disponibles au public générées pour A. tuberculatus ont été réassemblées en utilisant les mêmes méthodes de calcul que pour A. hypochondriacus. Dans nos mains, cependant, l’assemblage a donné un ratio de contigs/singletons (12 216/53 803) qui différait de celui rapporté par les anciens travailleurs (22 035/22 434), peut-être en raison de l’utilisation de différents assembleurs. La divergence s’est produite malgré le fait que 83% du total des lectures brutes d’A. tuberculatus entrant dans le processus a été assemblé. L’alignement BLASTN des 12 216 contigs A. tuberculatus résultants avec les 21 207 isotigs/contigs A. hypochondriacus a donné 8 260 séquences homologues (E ≤ 1 × 10-10 et identité ≥ 90 %). Le nombre de contigs de chaque espèce qui ont produit des résultats significatifs (E ≤ 1 × 10-10) lorsqu’ils ont été interrogés dans les bases de données Uniref 100 et Amaranthaceae ESTs, est présenté dans le tableau 3. L’utilisation combinée des informations ci-dessus a permis de quantifier le nombre de contigs homologues produisant le même résultat, des résultats différents, un résultat pour une espèce et aucun pour l’autre, et vice-versa, et aucun résultat. Les résultats obtenus sont présentés dans le tableau 4. L’analyse des transcrits homologues annotés avec la base de données EST des Amaranthaceae a indiqué que la majorité avait une fonction/provenance inconnue (21%). La plus grande proportion (71%) a été trouvée dans les bibliothèques EST générées à partir de graines immatures et de tissus floraux de Chenopodium quinoa, d’inflorescences, de tissus en germination, de racines à différents stades de développement, d’hypocotyles, de tiges de graines et de cotylédons de racines de betteraves et de cellules de chlorenchyme de l’espèce C4 non-Kranz Bienertia sinuspersici. Les gènes liés au stress constituaient la plus petite fraction (8 %), principalement représentée par des EST générés à partir d’espèces halophytes soumises au stress salin (Salicornia brachiata, Suaeda salsa, S. maritima, Atriplex centralasiatica et C. glaucum, en plus des EST provenant de tissus immatures de Salsola tragus. Tous les transcrits liés au stress biotique identifiés provenaient de bibliothèques d’ADNc de racines de betteraves soumises à l’alimentation de la mouche (Tetanops myopaeformis). D’autre part, deux tiers des transcrits homologues annotés avec la base de données Uniref100 avaient une fonction inconnue. La classification subséquente des transcrits (33%) ayant une fonction assignée dans la catégorie des processus biologiques a placé la majorité d’entre eux (16%) dans un groupe composé de fonctions domestiques de base (par exemple, l’organisation et la biogenèse des composants cellulaires, le cycle cellulaire, la mort cellulaire, la régulation de l’expression des gènes, la traduction, l’homéostasie cellulaire, la morphogenèse et la croissance des structures anatomiques, les processus métaboliques des glucides, des protéines et de l’ADN, le transport et la photosynthèse), le métabolisme primaire et secondaire (7%), la transduction du signal et la régulation de la transcription (4%). Le reste comprenait des transcrits exprimés en réponse à un stress biotique (2%) et abiotique (4%). La majorité de ces derniers ont été isolés à partir d’Amaranthaceae et d’halophytes apparentés principalement exposés au stress salin. Les gènes intéressants liés au stress (a)biotique présents dans les deux espèces comprennent une protéine associée au plastide-lipide connue pour être induite en réponse à de multiples stress dans de nombreuses espèces végétales, AtPOB1, une protéine à domaine BTB/POZ qui s’est avérée réguler positivement les réponses aux maladies chez Arabidopsis et le tabac, la protéine de la sève du phloème AtPP2-A1 dont la surexpression chez Arabidopsis a fortement réprimé l’alimentation du phloème par le puceron vert du pêcher Myzus persicae, un transcrit similaire à la protéine de transfert de lipides non spécifique de type 2 de Tamarix hispida, dont l’expression s’est avérée faire partie d’une réponse adaptative aux stress abiotiques chez cette espèce, la polyamine oxydase, une enzyme produisant du H2O2, supposée impliquée dans les processus de différenciation des parois cellulaires et les réponses de défense, qui s’est récemment avérée nécessaire à la cicatrisation des blessures chez le maïs, la méthionine sulfoxyde réductase, qui s’est avérée active dans la défense contre les pathogènes chez les poivrons, par le biais de la régulation de l’état d’oxydoréduction des cellules, et l’ARN hélicase 7 DEAD-box ATP-dépendante, un type de protéine de réparation de l’ADN dont il a été récemment démontré qu’elle confère une résistance multi-stress lorsqu’elle est exprimée dans les plantes. L’identification de plusieurs gènes liés à l’homéostasie et à la tolérance aux ions de métaux lourds, à la détoxification des cations, au transport de l’eau et à la biosynthèse et à la transduction du signal des phytohormones liées au stress (par exemple, l’acide abscissique et le JA) a également été remarquable (voir le fichier supplémentaire 5).
Le nombre de transcrits annotés qui ont été détectés dans une seule espèce était comparativement important (tableau 5). Un exemple illustratif des différences observées entre les transcriptomes de la mauvaise herbe et de l’amarante des grains est donné par l’analyse des gènes cibles d’herbicides qui ont été annotés avec les bases de données UniRef 100 et Amaranthaceae ESTs. Elle a indiqué que 29 d’entre eux ont été trouvés dans les deux espèces, tandis que 13 et 8 séquences ont été trouvées seulement dans A. hypochondriacus et A. tuberculatus, respectivement (tableau 6).
Les paramètres plutôt rigoureux employés pour la comparaison des transcriptomes pourraient avoir conduit aux différences transcriptomiques ici observées, bien que l’utilisation de seuils de valeur E plus faibles (disons E ≤ 1 × 10-5) pourrait ne pas avoir beaucoup contribué à augmenter le niveau d’homologie des transcriptions, comme le suggère une étude précédente de séquençage du génome chez Eucalyptus grandis. Cependant, une autre explication possible plus plausible est que les divergences ci-dessus étaient le reflet de différences fondamentales dans la conception expérimentale globale utilisée pour générer les deux données transcriptomiques. Par exemple, de nombreux gènes liés au stress biotique détectés chez A. hypochondriacus étaient absents chez A. tuberculatus (résultats non montrés). Une hypothèse alternative proposant que la différence observée soit due à une importante divergence de séquence survenue au cours de la spéciation/domestication nécessitera de nombreuses recherches supplémentaires pour être validée.
Profilage d’expression numérique
Profil transcriptionnel sensible au stress dans les feuilles
Cette technique, également connue sous le nom d’échantillonnage de balises ou RNA-seq, est considérée comme une méthode efficace pour l’analyse de l’expression génique . L’analyse de profilage d’expression numérique réalisée pour A. hypochondriacus a identifié un total de 1 971 gènes exprimés de manière différentielle en réponse à au moins un des quatre traitements de stress testés (c’est-à-dire le stress hydrique, le stress salin, l’herbivorie des insectes et l’infection bactérienne) (fichier supplémentaire 6). Cinquante profils d’expression génique différents ont été générés pour déterminer l’influence d’un traitement de stress donné sur les niveaux d’expression d’un gène particulier. Les résultats sont présentés dans la figure 4. Une caractéristique évidente de cette analyse est le pourcentage élevé de gènes non annotés ou de gènes à fonction inconnue qui ont été induits par le stress. Ceux-ci représentent une source potentiellement riche de matériel génétique qui pourrait être analysé systématiquement pour la découverte de gènes impliqués dans de nouveaux mécanismes de résistance au stress.
Tous les gènes inductibles par le stress avec une fonction connue qui ont été identifiés dans 41 des 50 catégories d’expression génique ont également été tabulés (fichier supplémentaire 7). Il s’agit notamment de plusieurs TF connus pour être des régulateurs des réponses au stress chez d’autres espèces végétales, par exemple la protéine AREB-like, la protéine contenant un domaine à doigt de zinc de type Dof, la protéine contenant un domaine BTB/POZ, la protéine contenant un doigt de zinc GRF, la protéine RAP 2.4-like, le répresseur JAZ1, ATEBP/ERF72/RAP2.3 (apparenté à AP2-3), RAV, facteur de transcription de type MYB, protéine 2 de type TINY, facteur de transcription à doigt de zinc Cys2/His2, activateur de transcription se liant au motif GAGA, peu connu ; protéines à doigt de zinc SCOF-1, dont on a constaté qu’elles étaient induites par le stress dû au froid ou au sel chez Arabidopsis et d’autres plantes, apparemment pour renforcer l’expression génique dépendante d’ABRE, facteur de transcription NAC putatif, et histone-fold/TFIID-TAF/NF-Y . D’autres ont été identifiés chez plusieurs xérophytes/halophytes comme des facteurs possibles qui contribuent à leur capacité à coloniser des habitats extrêmes, par exemple lycopène synthase protéines de canal d’eau , myo-inositol-1-phosphate synthase, cystathionine gamma-synthase phosphoenolpyruvate carboxylase , Na+/H+ antiporteur , protéine phosphatase-2C , Ca2+/H+ antiporteur , calcineurine B-like protéine , inositol monophosphatase , et protéine hydrophile induite par le sel .
Sans surprise, de nombreux transcrits codant pour des piégeurs d’oxygène réactif se sont révélés fortement induits, dont beaucoup par des stress multiples, par exemple la superoxyde dismutase, la glutathion S-transférase Z1, l’oxydase de type germin et plusieurs catalases, peroxydases et ascorbate peroxydases. De plus, l’induction forte et multiple de l’aspartyl protéase, de diverses protéases à cystéine, d’une protéase de type subtilisine et d’une enzyme de traitement vacuolaire (VPE) soutient un rôle pour les processus de recyclage des protéines en réponse au stress, de manière similaire à ce qui a été trouvé pendant le processus de compétence d’adaptation au stress de la salinité chez l’extrêmophile T. halophila, tandis que l’expression des expansines, des xyloglucanes endotransglycosylases, de plusieurs sous-unités de la cellulose synthase, de protéines riches en glycine, proline et hydroxyproline est soutenue par la capacité observée d’ajuster les propriétés de la paroi cellulaire chez de nombreuses plantes soumises à un stress. Beaucoup de ces gènes actifs sur les glucides étaient également fortement exprimés dans les tiges (voir ci-dessous).
D’une importance particulière étaient les gènes fortement exprimés par plusieurs traitements de stress, non signalés précédemment dans l’amarante ou les halophyles/extrémophyles apparentés. Ceux-ci ont des applications biotechnologiques potentielles évidentes et pourraient également contribuer à l’élucidation des mécanismes moléculaires conduisant à la résistance à des conditions de stress multiples. Une sélection comprend les éléments suivants : Drm3, nécessaire pour la méthylation de l’ADN de novo chez Arabidopsis thaliana où il est proposé de réguler les processus de silençage des gènes ; Enhancer of SOS 3- 1 qui code pour une protéine localisée dans le chloroplaste qui interagit avec les régulateurs SOS3 et SOS2 de la tolérance au stress salin chez Arabidopsis ; YCF3 et HCF101 (high chlorophyll fluorescence 101) protéines considérées comme essentielles pour l’assemblage et l’accumulation du complexe du photosystème I (PSI) et la prévention des dommages photo-oxydatifs ; le facteur d’initiation de la traduction eIF1, qui s’est révélé être un déterminant de la tolérance au sodium chez la levure et les plantes, ce qui implique que la traduction est une cible de la toxicité du sel et que son rétablissement pourrait être un mécanisme crucial pour la survie cellulaire dans des conditions de stress au NaCl, en plus de la régulation proposée de l’accumulation d’ions et de l’état redox intracellulaire ; la protéase 9 FtsH dépendante de l’ATP, impliquée dans la dégradation de la protéine D1 de la PSII, une étape nécessaire pour éviter l’accumulation de niveaux excessifs d’espèces réactives de l’oxygène ; le transporteur d’électrons ACD1-LIKE, ressemblant au produit du gène de la mort cellulaire accélérée d’Arabidopsis, impliqué dans l’oxygénation du phéophorbide a qui est nécessaire pour empêcher la destruction photooxydative de la cellule et qui s’avère également régulé à la hausse pendant le processus d’adaptation au stress salin chez T. halophila ; le gène PHB1 de la prohibitine, dont on a constaté que les membres de la famille s’accumulent en réponse à différentes conditions de stress chez de nombreuses plantes, probablement pour agir comme des protecteurs de la fonction et de l’intégrité des mitochondries, des déclencheurs de la signalisation rétrograde de la mitochondrie au noyau et/ou des médiateurs de l’interaction entre H2O2 et NO, par un mécanisme encore indéfini ; la protéine Yellow Stripe Like 6, dont les membres sont supposés participer à l’acheminement des micronutriments métalliques vers et depuis les tissus vasculaires, ainsi qu’à la tolérance et à l’hyperaccumulation des métaux ; protéine variante de l’histone H1 de liaison putative, exprimée par des conditions de stress de sécheresse chez la tomate, et agissant par un mécanisme autre que l’organisation de la chromatine qui est proposé pour impliquer une régulation négative de la conductance stomatique ; GASA-1/LtCOR1-like, une protéine régulée par la gibbérelline putativement impliquée dans la régulation de la maturation des fruits ou l’établissement de l’état de dormance dans les méristèmes cambiaux des arbres ; les chaînes bêta et gamma-tubuline, dont l’expression coïncide avec le rôle de plus en plus important joué par le cytosquelette dans la médiation de la réponse de la cellule végétale au stress ; le facteur d’initiation de la traduction 5A, dont on a découvert qu’il était impliqué dans une régulation apparemment isoforme-dépendante des voies de réponse au stress et de la résistance par un mécanisme largement inconnu ; le gène argonaute 4-like, la principale protéine impliquée dans la méthylation de l’hétérochromatine et récemment reconnue comme un facteur critique pour la signalisation systémique médiée par les petits ARN, nécessaire pour les réponses au stress (a)biotique des plantes et la privation de nutriments ; une arginase putative, qui met en évidence le rôle de l’arginine en tant que précurseur de la biosynthèse des polyamines et de l’oxyde nitrique, utilisés comme messagers pour l’adaptation des plantes au stress, et la protéine lectine Hfr-2 de type toxine formant des pores, reconnue comme un important facteur de résistance biotique chez le blé contre l’infestation par la mouche de Hesse et l’infection fongique (Puccinia striiformis), et impliquée dans le changement de phase végétative chez le maïs, mais sans fonction connue dans la régulation du stress abiotique. La caractérisation fonctionnelle d’un ensemble sélectionné de gènes A. hypochondriacus inductibles par un stress multiple, dans Arabidopsis, le tabac et/ou l’amarante des grains, est actuellement en cours dans notre laboratoire.
Profil transcriptionnel dans les tiges
La comparaison de la bibliothèque d’ADNc dérivée des tiges (S6) avec celles générées à partir de feuilles soumises à un stress biotique et abiotique (S2 à S5) a permis d’identifier un petit groupe de transcrits dont l’expression a été exclusivement détectée dans les tiges. De façon remarquable, l’accumulation de plusieurs autres transcrits était plus élevée dans les tiges que dans les tissus foliaires de plantes amarante exposées à un stress (a)biotique (voir fichier supplémentaire 8). Le profil de transcription observé était cohérent avec les données précédemment rapportées pour les analyses transcriptomiques de la tige chez Arabidopsis thaliana. Tous les transcrits annotés ont été classés dans différentes catégories, de manière similaire aux études précédentes.
La biosynthèse de la lignine et de la cire de cuticule était représentée par des gènes codant pour des protéines vraisemblablement impliquées dans la biosynthèse des monolignols (par ex. cytochrome P450 réductases, nécessaires à l’activité de plusieurs enzymes clés du cytochrome P450 de la voie des phénylpropanoïdes), le transport du monolignol (par exemple les transporteurs ABC) et l’exportation des lipides cuticulaires (par exemple la famille des transporteurs ABC complexe blanc-brun). Le nombre modeste de gènes de biosynthèse de la lignine régulés à la hausse qui ont été détectés était probablement lié à l’utilisation de jeunes plantes d’amarante, ne subissant pas encore de lignification active, pour l’expérimentation.
La catégorie des enzymes actives sur les glucides était fortement représentée. Cela n’était pas surprenant si l’on considère que ces protéines jouent un rôle fondamental dans la biosynthèse et la modification de la paroi cellulaire et sont donc étroitement régulées pendant le développement de la tige. Elle comprenait un certain nombre de glycosyl transférases et plusieurs glycosyl hydrolases (GH) représentant des familles comprenant la cellulase (GH9), la β-1,3-glucanase (GH3), xylanase (GH10), xyloglucane endotransglucosylase-hydrolase (GH16), glucane endo-1,3-beta-D-glucosidase (GH17), invertase (GH31) et β-D-galactosidase (GH35). Ces enzymes sont diversement requises pour le relâchement et l’allongement de la paroi cellulaire, la formation des parois cellulaires secondaires des tissus vasculaires, l’hydrolyse du squelette du xylane, les modifications post-traductionnelles (comme les glycosylations) des protéines et la mobilisation de l’énergie sous forme de saccharose. Les pectines méthylestérases (PME) impliquées dans la modification des propriétés physiques, chimiques et biologiques des pectines ont également été détectées. L’expression concomitante d’un inhibiteur de la PME a probablement représenté un besoin de réguler la PME dans les jeunes tiges d’amarante afin d’éviter la rigidification des parois associée à l’activité de la PME. En outre, une protéine β-expansine putative a été détectée ; ces protéines modulent l’interaction entre les hémicelluloses et la cellulose, probablement via une rupture de leurs liaisons hydrogène partagées.
Dans le groupe des oxydo-réductases extracellulaires, on a trouvé deux peroxydases, appartenant aux familles peroxydase 25 et 64, respectivement. On a constaté que les peroxydases sont exprimées à des niveaux modérés à élevés dans les tiges en développement, où l’on pense qu’elles réduisent l’extensibilité de la paroi cellulaire en raison de leur rôle dans la formation de liens covalents entre les résidus de pectine, les protéines riches en hydroxyproline comme les extensines, et les précurseurs de la lignine. Un gène codant pour une oxydase multicuivre de la famille SKS (SKS5) a été identifié. La fonction de ces protéines dans le développement des tiges n’est pas bien connue, bien que l’on ait récemment constaté que l’expression de SKS5 était régulée à la hausse dans les écotypes hyperaccumulateurs de métaux de Thlaspi caerulescens. Une autre oxydo-réductase identifiée dans les tiges d’amarante était une protéine 2-OG-Fe(II) oxygénase de fonction inconnue qui a récemment été trouvée associée aux mécanismes de défense contre les infections fongiques chez Arabidopsis .
Plusieurs gènes codant pour des protéines avec des domaines d’interaction putatifs avec des polysaccharides et/ou d’autres protéines ont été identifiés. De nombreux gènes classés dans cette catégorie sont des kinases, des récepteurs peptidiques et des kinases semblables à des récepteurs qui régulent les processus de développement chez les plantes, comme le récepteur de type CLAVATA1, le récepteur lié à CLAVATA3/ESR, le récepteur de forme anormale de la feuille 2, la kinase semblable à un récepteur riche en leucine RLK7 et la kinase LRR XI-23. Un certain nombre de protéines (glyco) riches en hydroxiproline, représentant très probablement les protéines arabinogalactanes (AGP), les protéines structurelles (par exemple, les extensines, les protéines riches en proline, PRP) et une prolyl 4-hydroxylase apparentée (sous-unité alpha-2 catalytique) nécessaire à l’hydroxylation des résidus de proline, étaient également fortement exprimées dans les tiges. De nombreux rôles des AGP dans le développement des plantes ont été suggérés par le biais de leur influence sur la détermination du destin cellulaire, l’embryogenèse somatique et la prolifération cellulaire. En outre, les AGP ont été supposés être des molécules de signalisation et s’associer à des polysaccharides pectiques, tandis que les extensines, les PRP et d’autres (par exemple, les protéines riches en glycine) se sont révélés être exprimés dans des types de cellules spécifiques, y compris les tissus du xylème et du phloème .
On trouvait également des gènes codant pour une endopeptidase de type Rhomboïde 2, et deux protéines à activité inhibitrice : un inhibiteur de la protéine de transfert des lipides/trypsine-alpha amylase et un inhibiteur de la cystéine protéinase. En outre, les transcriptions d’une protéine F-Box (SKIP2) et d’une sous-unité régulatrice non-ATPase du protéasome 26S, connues pour être impliquées dans la dégradation ciblée des protéines déclenchée en réponse à divers stimuli pendant la croissance et/ou diverses conditions de stress, ont également été détectées. Il a été suggéré que l’activité protéinase et sa modulation par les inhibiteurs de protéinase est nécessaire pour le traitement et/ou le renouvellement des protéines de la paroi cellulaire, la génération de signaux peptidiques, la mort cellulaire programmée et/ou l’équilibrage des taux d’expansion/prolifération cellulaire, qui sont collectivement nécessaires pour le bon développement de la tige .
Parmi la catégorie des protéines diverses, on a trouvé des gènes codant pour des protéines impliquées dans le métabolisme des lipides (GDSL-lipases et une glycérophosphoryl diester phosphodiestérase putative ), qui sont suggérés comme étant importants pour le développement de la tige, une plantacyanine liant le cuivre (ARPN), supposée réguler les processus d’oxydo-réduction dans les parois cellulaires, plusieurs protéines connues pour être nécessaires au maintien des cellules de la tige dans le méristème apical des pousses (histone H2A ; histone kinase Aurora 2), la tolérance aux métaux (par ex.sélénocystéine méthyltransférase) et des composants du cytosquelette, très probablement impliqués dans la division et l’élongation cellulaire. La découverte d’un transcrit codant pour la sous-unité catalytique LigB d’une famille de dioxygénases à ouverture de cycle aromatique (c’est-à-dire une dopa dioxygénase putative), l’enzyme principale de la biosynthèse de la bétacyanine, et de glycosyltransférases (GT) apparentées sur le plan biosynthétique (par exemple la GT de Phytolacca Americana et une UDP-GT) était cohérente avec le phénotype hautement pigmenté du tissu de la tige utilisé pour générer la bibliothèque d’ADNc séquencée. La détermination de la structure et de la régulation des gènes liés aux pigments, de leurs modèles d’expression liés aux tissus et au stress, et de leur rôle probable dans la défense contre l’herbivorie des insectes chez l’amarante des grains est maintenant activement poursuivie dans notre laboratoire. Plusieurs TF ont également été détectées. Conformément à un rapport précédent, la plupart des TF fortement exprimées dans les tissus de la tige de l’amarante des grains appartenaient aux familles MYB, AP2-EREBP, GRAS, bHLH-domaine et homéodomaine (par exemple WOX4). Les TFs dans les tiges ont été diversement associés à la régulation de la bio-genèse et de la différenciation des tissus vasculaires, à l’expression des gènes des phénylpropanoïdes et au développement des fibres. Enfin, un niveau élevé d’expression a été trouvé pour plusieurs gènes liés au stress abiotique et à la défense dans les tiges de A. hypochondriacus. La présence de gènes liés à la défense fortement exprimés était en accord avec un rapport récent montrant que les gènes impliqués dans la défense des plantes et les fonctions protectrices étaient dominants dans les tiges en développement de Populus trichocarpa. À cet égard, la présence concomitante d’une jasmonate o-méthyl transférase putative et d’un gène de carboxylestérase CXE codant pour une protéine qui peut vraisemblablement identifier le jasmonate de méthyle (MeJA) comme son substrat (en plus du salicylate de méthyle et de l’indol-3-acétate) chez Actinidia arguta, plaide en faveur d’un rôle possible du MeJA dans la signalisation, à la fois au sein et entre les plantes d’amarante, pendant le stress biotique et/ou abiotique. D’autres gènes intéressants identifiés dans les tiges d’amarante, auxquels un rôle actif dans la défense contre les pathogènes a été récemment attribué, comprennent ceux qui codent pour une époxyde hydrolase 2 et une VPE-1B, respectivement. On pense que le rôle de l’époxyde hydrolase dans la défense est associé à son implication dans la détoxification, la signalisation et/ou le métabolisme des composés antimicrobiens, tandis que l’importance du VPE est due à son implication dans l’immunité déclenchée par les éliciteurs, liée à l’induction combinée d’une réponse hypersensible (HR) et de la fermeture des stomates. Comme mentionné ci-dessus, l’expression du VPE a également été associée aux réponses au stress abiotique.