Animali
S. purpuratus sono stati mantenuti in acqua marina artificiale a 14 °C. L. anatina sono stati raccolti nel giugno 2016 nelle zone umide di Xiangshan, distretto di Xiangshan, città di Hsinchu, Taiwan (coordinate GPS 24.770779, 120.910742 E), trasportati al laboratorio su ghiaccio e poi sezionati immediatamente.
Costruzioni e plasmidi
Per determinare l’attività enzimatica di SpAIDLs e LaAIDLs, rispettivi vettori di espressione batterica pASK-SpAIDLX/LaAIDLX/HsAID sono stati generati per SpAIDL1, 2, 3, 4a, 9, LaAIDL1, 2 e HsAID. Le cornici di lettura aperte di ogni SpAIDL sono state amplificate dal DNA genomico mediante PCR utilizzando la polimerasi Phusion e primer contenenti siti di restrizione SpeI e XhoI (Tabella 1 supplementare). I prodotti di PCR sono stati digeriti con SpeI e XhoI (New England Biolabs) e inseriti nei siti NheI/XhoI di pASK-TadA (un dono del Dr. Nina Papavasiliou, Rockefeller University, New York) sostituendo il telaio di lettura aperta TadA. Per SpAIDL9 questa strategia di clonazione cambiato il terzo amminoacido da fenilalanina a serina, e questa mutazione F3S è stato invertito di nuovo a F3 utilizzando il kit di mutagenesi Quikchange (Stratagene) con primer SPA9S3FT/SPA9S3FB (Tabella 1 supplementare). HsAID è stato amplificato da un plasmide contenente AID umana a lunghezza intera (pCDF-AID, un dono del Dr. Nina Papavasiliou, Rockefeller University, New York). La strategia di clonazione ha cambiato il secondo amminoacido da aspartato ad alanina, e D2A è stato riportato a D2 utilizzando il kit di mutagenesi Quikchange (Stratagene) con primer hAIDA2DT/hAIDA2DB (Tabella 1 supplementare). Il pASK vuoto è stato generato dalla digestione NheI/XhoI di pASK-TadA, riempiendo le sporgenze utilizzando Klenow polimerasi, e la legatura con T4 DNA ligasi (Thermo Scientific). Le cornici di lettura aperta di ogni LaAIDL sono stati amplificati da L. anatina cDNA e clonato nel vettore di clonazione pJET1.2/blunt (Thermo Scientific). Le cornici di lettura aperta LaAIDLX sono stati escissi con SpeI e XhoI (New England Biolabs), e clonato nei siti XbaI / XhoI di pASK_V5-SpAID4a (descritto di seguito), sostituendo l’inserto SpAID4a. Va notato che i frammenti clonati contengono i codoni di stop originali alle loro estremità 3′ in modo che la proteina espressa non contiene un tag V5.
I costrutti di espressione per i mutanti del sito attivo di SpAIDL1 e LaAIDL1 (SpAIDL1 H86R E88Q, SpAIDL1 H86R E88Q C123A C126A, e LaAIDL1 H81R E83Q H298R E300Q) sono stati generati mediante mutagenesi sito-diretta dai rispettivi plasmidi wild-type (o singoli mutanti) utilizzando il kit di mutagenesi Quikchange (SPA1H85RE87QT/SPA1H85RE87QB per SpAIDL1 RQ), o tramite PCR convenzionale usando primer fosforilati al 5′ (SPA1CCAA-P/SPA1CCAAB per la seconda serie di alterazioni in SpAIDL1 RQAA, e LaA1H81RE83QB/LaA1H81RE83Q-P e LaA1H298RE300QB/LaA1H298RE300Q-P per SpLaAIDL1 RQRQ) seguita da digestione DpnI, legatura per circolarizzare i prodotti, e trasformazione in E. coli competente. coli.
Per monitorare il livello di espressione della proteina ricombinante in E. coli, i costrutti di espressione batterica pASK_V5-SpAIDLX/LaAIDLX/HsAID sono stati creati. pASK_V5 è stato generato annealing gli oligonucleotidi pASK_V5F/pASK_V5R (Tabella supplementare 1) contenente la sequenza tag V5, e legandoli nei siti NheI/SalI di pASK-TadA. I plasmidi pASK-SpAIDLX/LaAIDLX sono stati utilizzati come modelli per amplificare i rispettivi cDNA senza codone di stop, utilizzando la polimerasi Phusion e i primer elencati nella tabella 1 supplementare, e clonati nei siti NheI/XhoI (per SpAIDLX e frammenti HsAID) o XbaI/XhoI siti (per i frammenti LaAIDLX) di pASK_V5. HsAID è stato amplificato da pASK-hAID. Le sequenze di entrambi, SpAIDL9 e HsAID, sono stati nuovamente modificati da questa strategia di clonazione, e sono stati cambiati indietro alle sequenze corrette come descritto sopra.
Preparazione del DNA genomico
DNA genomico di entrambi, S. purpuratus e L. anatina, sono stati purificati utilizzando il gDNA Spin Kit Tissue (Bioman) seguendo le istruzioni del produttore. In breve, circa 1 × 106 celomociti di S. purpuratus e 100 mg di tessuto di L. anatina sono stati aggiunti a provette da microcentrifuga separate, omogeneizzati in 200 µl di buffer GT (Bioman) contenente 200 mg di proteinasi K e incubati per 30 minuti a 60 °C per lisciare completamente le cellule. Dopo l’aggiunta di 200 µl di buffer BG (Bioman), i campioni sono stati vortexati e incubati per 20 minuti a 70 °C. Successivamente sono stati aggiunti 200 µl di etanolo e l’intero campione è stato caricato su una colonna di spin GD (Bioman). I lavaggi con 400 µl di tampone WI (Bioman) e 600 µl di tampone di lavaggio sono stati eseguiti mediante centrifugazione a 10.000×g per 30 s. Questo è stato seguito dall’eluizione del DNA genomico con 100 µl di tampone di eluizione (10 mM Tris pH = 8.0) preriscaldato a 60 °C.
Preparazione dell’RNA e sintesi del cDNA
Il liquido celomico di S. purpuratus è stato prelevato con una siringa attraverso la membrana periostomale e miscelato immediatamente con un volume uguale di CMSFW-EI (0,53 M NaCl, 10 mM KCl, 2,4 mM NaHCO3, 11 mM Na2SO4, 30 mM EDTA, 50 mM imidazolo). I celomociti sono stati centrifugati e risospesi in 800 μl di EasyPure Total RNA Reagent (Bioman). L’esofago, intestino tenue, intestino crasso, e gonadi da S. purpuratus e il peduncolo, cieco digestivo, gonade e intestino da L. anatina sono stati sezionati da singoli animali. Piccoli pezzi di S. purpuratus e L. anatina tessuti solidi sono stati aggiunti a 200 μl EasyPure Total RNA Reagent (Bioman), e i campioni sono stati omogeneizzati in un frullatore Bullet (Next Advance) utilizzando 0,5 mm perline ZrO. I detriti insolubili sono stati centrifugati e i surnatanti sono stati trasferiti in provette fresche contenenti 600 μl di EasyPure Total RNA Reagent (Bioman) e 200 μg di glicogeno come vettore. L’RNA totale è stato poi purificato secondo il protocollo del produttore. Per rimuovere il gDNA residuo e altri contaminanti, S. purpuratus RNA sono stati poi ulteriormente trattati utilizzando il Turbo DNA-free kit (Ambion) o il kit RNeasy mini (Qiagen). Il kit Turbo DNA-free (Ambion) è stato utilizzato secondo il protocollo del produttore, tranne che extra MgCl2 (2,5 mM) e CaCl2 (1 mM) sono stati aggiunti per la digestione DNase. Il kit RNeasy mini (Qiagen) è stato utilizzato secondo il protocollo del produttore.
Circa 250-500 ng di S. purpuratus e L. anatina RNA da ogni tessuto sono stati convertiti in cDNA utilizzando il ThermoScript RT-PCR System (Invitrogen) o il ToolsQuant II Fast RT Kit (Biotools), rispettivamente. In entrambi i casi sono stati utilizzati esameri casuali e sono state seguite le istruzioni del produttore.
Amplificazione rapida delle estremità del cDNA
Le estremità 5′ e 3′ dei trascritti SpAIDL9 sono stati amplificati utilizzando il kit SMARTer RACE (Clontech) e il gene specifico primer SPA9CR1, SPA9CR2, SPA9CF1, SPA9CF2 (vedi tabella 2 supplementare) secondo le istruzioni del produttore. I prodotti PCR contenenti le estremità 5′ e 3′ delle trascrizioni sono stati clonati nel vettore di clonazione pJET1.2/blunt (Thermo Scientific), e i singoli cloni sono stati sequenziati interamente.
Analisi delle sequenze dei geni SpAIDL
DNA genomico da tre individui S. purpuratus (Sp105, Sp111, Sp112) sono stati usati come template per amplificare gli open reading frame di SpAIDL1, 2, 3, 4a, 9 usando la polimerasi Phusion e i primer elencati nella tabella 2 supplementare. I prodotti di PCR sono stati clonati nel vettore di clonazione pJET1.2/blunt (Thermo Scientific). I plasmidi sono stati purificati utilizzando il kit Tools mini plasmide (Biotools) e sottoposti a un servizio commerciale (Genomics Taiwan) per il sequenziamento utilizzando il pJET1.2 avanti o il pJET1.2 primer inverso.
Almeno otto sequenze sono state raccolte per ogni gene da ogni riccio di mare, e le sequenze di primer sono stati esclusi per prima degli allineamenti di sequenza. Le sequenze nucleotidiche per ogni gene sono state prima allineate all’interno di ogni S. purpuratus utilizzando CLUSTALW (www.genome.jp/tools/clustalw), e le sequenze dominanti corrispondenti ai due alleli sono state selezionate per il successivo confronto tra i singoli ricci di mare.
Analisi dell’espressione genica
Il DNA complementare di tre individui S. purpuratus (Sp146, Sp147, Sp148) e due individui L. anatina (La1 e La3) sono stati usati come modelli per testare l’espressione di SpAIDL1, 2, 3, 4a, e 9, o LaAIDL1 e 2 mediante PCR quantitativa. Ogni reazione qPCR (10 μl) conteneva 5 μl di Fast SYBR Green Master Mix (Applied Biosystems), primer (0,1 μM) (vedi tabella 3 supplementare) e 1 μl di modello, e per ogni campione sono stati impostati due replicati tecnici. Le reazioni qPCR sono state eseguite in un 7500 Fast Real-Time PCR System (Applied Biosystems), applicando una fase di denaturazione iniziale a 95 °C per 20 s seguita da 40 cicli di 3 s a 95 °C e 30 s a 60 °C. Le curve standard sono state utilizzate per determinare i livelli di espressione genica e i geni housekeeping (Sp18S per S. purpuratus e LaRPL39 per L. anatina) sono stati utilizzati per la normalizzazione.
Modello di infezione batterica
Vibrio diazotrophicus sono stati coltivati in colture liquide Difco marine broth (Becton Dickinson) a 30 °C e 250 rpm per una notte. Sei ricci di mare sani sono stati selezionati a caso e divisi in due gruppi, un gruppo sperimentale e un gruppo di controllo. Aliquote di liquido celomico (0,5 ml) sono state prelevate da ogni animale a t = 0. Ai ricci di mare del gruppo sperimentale è stata iniettata una sospensione di Vibrio diazotrophicus vivo in 200 µl di acqua di mare artificiale sterile con la quantità di batteri regolata per ogni riccio di mare per corrispondere a 106 cellule/ml di volume totale del liquido celomico. Il gruppo di controllo è stato iniettato con 200 µl di acqua di mare sterile. A t = 6, 24 e 48 ore, 200 µl di liquido celomico sono stati prelevati da ogni animale in ogni gruppo. L’RNA è stato estratto dai celomociti ottenuti in ogni momento, e dai campioni t = 0 è stato preparato anche il DNA genomico. Le coppie di primer per l’analisi di espressione genica (Tabella 3 supplementare) sono stati prima testati sui campioni di DNA genomico per garantire che possono amplificare il rispettivo gene da ogni individuo, nonostante i notevoli livelli di livelli di polimorfismo nella loro sequenza all’interno della popolazione S. purpuratus (vedi Fig. 1b). La RT-PCR quantitativa (come descritto sopra) è stata utilizzata per misurare i livelli di espressione genica con almeno due repliche tecniche per campione. Valori di espressione sono stati prima normalizzati ai livelli di 18S in ogni campione, e poi ai valori a t = 0 per ogni animale. Tre repliche biologiche sono state utilizzate per il gruppo sperimentale e di controllo, e tutti i punti di dati sono mostrati.
Saggi CDA con resistenza kanamicina reporter
Un protocollo ottimizzato di un saggio ampiamente utilizzato per misurare attività CDA polinucleotide26 è stato utilizzato. Il plasmide pTAC-Kan reporter deaminasi contenente una mutazione puntiforme L94P nel gene KanR e singoli vettori di espressione pASK-SpAIDLX/LaAIDLX sono stati trasformati in sequenza nel ceppo di E. coli BH156 con deficit di UNG. Il vettore di espressione AID umano pASK-HsAID e il vettore vuoto pASK servito come controlli positivi e negativi, rispettivamente. Per il saggio di deaminasi, almeno otto colonie individuali per ogni deaminasi putativa sono stati coltivati in brodo LB (contenente 50 μg/ml di ampicillina (Amp), 50 μg/ml di spectinomicina (Spc), e 17 μg/ml di cloramfenicolo (Cam)) fino a quando la densità ottica a 600 nm raggiunto 0,3. Ogni cultura è stata poi divisa a metà. Mentre IPTG (1 mM) è stato aggiunto a entrambi, l’anidrotetraciclina (AHT) (0.2 μg/ml) è stato aggiunto solo a uno di loro per indurre l’espressione di SpAIDLX/LaAIDLX. Dopo l’incubazione per 3 h a 37 ° C e 200 rpm, le culture sono state centrifugate, lavate con PBS, e diffuse su piastre LB contenenti 50 μg/ml di Amp, 50 μg/ml di Spc e 17 μg/ml di Cam, o 50 μg/ml di Amp, 50 μg/ml di Spc, 17 μg/ml di Cam, e 30 μg/ml di kanamicina (Kan). Le frequenze di reversione sono state calcolate come il rapporto tra il numero di colonie KanR e il numero totale di colonie sulla piastra Amp+Spc+Cam. La frequenza di reversione relativa è stata poi determinata come il rapporto delle frequenze di reversione da una coppia di colture batteriche identiche, in cui la trascrizione di KanR è stata indotta con IPTG in presenza o in assenza dell’espressione della deaminasi. Per confermare che le colonie KanR erano davvero il risultato della deaminazione del DNA, i plasmidi pTAC-Kan da colonie multiple sono stati purificati e la reversione del codone di stop confermata dal sequenziamento del DNA.
Saggi CDA usando rpoB come reporter
È stato usato un protocollo ottimizzato di un saggio ampiamente utilizzato per misurare le attività CDA del polinucleotide35 . I singoli vettori di espressione pASK delle deaminasi invertebrate sono stati trasformati separatamente in E. coli BH156 con deficit di UDG. Quattro ml di colture di mezzo LB contenente 100 µg/ml Amp, 17 µg/ml Cam e 0,3 µg/ml AHT sono stati inoculati con singole colonie batteriche. Le colture sono state coltivate per 24 ore a 37 °C 230 rpm, aliquote sono state piastrate su piastre di agar LB contenenti 100 µg/ml di Amp o 100 µg/ml di rifampicina, e coltivate a 37 °C per una notte. Le colonie sono state contate e le frequenze di reversione sono state calcolate come il rapporto tra il numero di colonie RifR e il numero di colonie AmpR dalla stessa cultura. Colture che esprimono HsAID o contenenti il vettore di espressione pASK vuoto servito come controlli positivi e negativi, rispettivamente. Sono state testate almeno otto colture per costrutto di espressione. Per determinare l’identità delle mutazioni nel gene rpoB da colonie resistenti alla rifampicina, sono state eseguite PCR da 24 colonie individuali usando la polimerasi Phusion e la coppia di primer rpoBF/rpoBR. I prodotti della PCR sono stati purificati su gel e sottoposti a sequenziamento usando il primer rpoBF. Le mutazioni sono state identificate per confronto con la sequenza WT (Genbank acc. CP024859.1, nt 2321219-2321797).
Espressione proteica delle deaminasi invertebrate in E. coli
Per monitorare il livello di espressione di SpAIDLX/LaAIDLX nei saggi di deaminasi, pASK_V5-SpAIDLX/LaAIDLX sono stati trasformati in BH156 con deficit di UNG. Le singole colonie sono state coltivate in brodo LB (contenente 50 μg/ml di Amp, 50 μg/ml di Spc, e 17 μg/ml di Cam) fino a quando la densità ottica a 600 nm era 0,3. IPTG (1 mM) e AHT 0.2 (μg/ml) sono stati aggiunti alla cultura per indurre l’espressione della proteina. Dopo l’incubazione per 3 ore (37 °C, 200 rpm), le culture sono state sedimento e lavate con PBS. Il pellet è stato lisato in 2x tampone campione SDS, diluito dieci volte, e separati su una coppia di 10% SDS-PAGE gel. Mentre un gel è stato colorato con blu Coomassie per valutare se sono state caricate quantità uguali di proteine, l’altro gel è stato trasferito su membrane PVDF da semi-secco trasferimento e V5-tagged deaminasi sono stati rilevati utilizzando un mouse anti-V5 anticorpo primario (Abcam, ab27671) e un perossidasi di rafano accoppiato coniglio-anti antisiero secondario del mouse (Jackson ImmunoReasearch). I segnali chemiluminescenti sono stati visualizzati utilizzando il substrato Immobilon Western Chemiluminescent HRP (Millipore) e la pellicola a raggi X o un sistema di imaging ChemiDoc Touch (BioRad). Immagini non tagliate di tutti i gel proteici colorati e western blot sono mostrati nella Fig. 5 supplementare. Tutti gli esperimenti di espressione batterica sono stati eseguiti in duplicato.
Bioinformatica
I confronti di sequenze al genoma del riccio di mare sono stati fatti utilizzando BLAST, BLASTP, o BLASTN a https://blast.ncbi.nlm.nih.gov/Blast.cgi o www.echinobase.org utilizzando sia i parametri standard o con filtro a bassa complessità spento. Gli allineamenti di sequenze multiple sono stati eseguiti utilizzando CLUSTALW e ottimizzati manualmente in base alle caratteristiche strutturali secondarie previste. Le analisi filogenetiche ed evolutive molecolari sono state eseguite utilizzando MEGA (versione 7)36.
Disponibilità dei dati
I dati delle sequenze che supportano i risultati di questo studio sono stati depositati in Genbank con i seguenti codici di accesso: SpAIDL1 (MH106904, MH106887, MH106888, MH106889, MH106890, MH106891), SpAIDL2 (MH048921, MH048922, MH048923, MH048924, MH048925), SpAIDL3 (MH106892, MH106893, MH106894, MH106895, MH106896, MH106897), SpAIDL4a (MH106905, MH080287, MH080288, MH080289, MH080290), SpAIDL9 (KY241384, KY241385, MH106898, MH106899, MH106900, MH106901, MH106902, MH106903), LaAIDL1 (MH106906), LaAIDL2 (MH106907).