Las proteínas abundantes en la embriogénesis tardía o LEAPs (del inglés Late-embryogenesis abundant proteins), son un amplio grupo de proteínas ubicuas descritas como altamente hidrofílicas, ricas en aminoácidos (aa) pequeños (Gly, Ala y Ser) y bajo contenido de Cys, Trp y Phe; por lo que su estructura posee alta flexibilidad y se considera como intrínsecamente desordenada (Battaglia et al. 2008). Las LEAPs se identificaron inicialmente por su elevada abundancia en la última etapa de la embriogénesis, durante el período de deshidratación de las semillas (Dure et al. 1981, Galau & Dure 1981). Actualmente se conoce que las LEAPs pertenecen a una superfamilia multifuncional presente en plantas, invertebrados y bacterias, y han sido ampliamente descritas como proteínas efectoras que también se expresan en tejidos vegetativos de plantas y en respuesta a diversas condiciones de estrés ambiental como frío, sequía, salinidad; así como a ácido abcísico (ej: Galau et al. 1986, Yu et al. 2016, Xiang & Man 2018, Chen et al. 2019, Guo et al. 2019, Dirk et al. 2020). Se han identificado grupos de LEAPs también inducidas por condiciones de estrés, conocidas como atípicas por presentar relativamente alta hidrofobicidad (Galau et al. 1993, Maitra & Cushman 1994).
Diferentes LEAPs se localizan en diferentes compartimentos subcelulares. Candat et al. (2014) mostraron experimentalmente que 36 de las 51 LEAPs de A. thaliana son citosólicas, algunas con difusión al núcleo, mientras que las restantes se localizan exclusivamente en plástidos, mitocondria, retículo endoplásmico, vacuola, pexofagosomas o son secretadas al espacio extracelular. Las LEA_4 se distribuyen ubicuamente dentro de las células.
El mecanismo bioquímico y molecular mediante el cual las LEAPs contribuyen a la protección de las plantas cuando confrontan condiciones ambientales adversas, no está bien definido. Por su naturaleza flexible, ha sido difícil determinar experimentalmente su estructura y definir su función. De acuerdo a ensayos bioquímicos in vitro y a fenotipos evidenciados por mutaciones en genes codificantes de LEAPs, se ha propuesto que estas proteínas podrían realizar más de una función: como secuestradores de iones, como antioxidantes, como chaperonas y escudos contra el calor, como estabilizadoras de membranas y antiagregantes de proteínas (Amara et al. 2014, Cuevas-Velázquez et al. 2014, Farrant et al. 2015). Posibles mecanismos de cómo las LEAPs protegen al proteoma susceptible ante condiciones de estrés, modificando el ambiente intracelular para mantener la homeostasis, se han revisado recientemente (Dirk et al. 2020).
Las LEAPs son codificadas en el genoma de las plantas por varias familias génicas que se diferencian entre sí por su secuencia proteínica, dominios conservados y motivos distintivos. Se han propuesto diferentes criterios de nomenclatura y clasificación de las LEAPs. En este trabajo nos basamos en las ocho familias reconocidas por los dominios descritos en Pfam (El-Gebali et al. 2019) y los grupos propuestos por Battaglia et al. (2008).
El número de genes para LEAPs en cada especie vegetal es variable. En Arabidopsis thaliana, se reportan 51 genes codificando nueve distintos grupos de LEAPs (Hundertmark & Hincha 2008). Varios de estos genes se han caracterizado funcionalmente (Guo et al. 1992, Artus et al. 1996, Manfre et al. 2006, Dang et al. 2014). En Oryza se identifican 26 loci en el ‘Rice Genome Annotation Project’ (rice.plantbiology.msu.edu), funcionalmente anotados por homología en EnsemblPlants como genes de LEAPs (plants.ensembl.org/Oryza_sativa/Info/Index). En plantas xerófitas adaptadas a sobrevivir bajo condiciones ambientales adversas y que muestran tolerancia a la desecación temporal (DT) de sus tejidos vegetativos, como Xerophyta viscosa, se identificaron 126 genes de LEAPs mostrando una expansión genómica respecto a otras plantas. Noventa genes mostraron una mayor acumulación de sus transcritos ante tratamientos de deshidratación y rehidratación de plantas adultas (Costa et al. 2017), sugiriendo una función de estos genes en la adaptación fisiológica a dichas condiciones. Análisis transcriptómicos en Craterostigma plantagineum indican que la acumulación de transcritos de LEAPs es uno de los componentes principales asociados a la DT (Giarola & Bartels 2015).
Una revisión comparativa de las ocho familias multigénicas de LEAPs (Pfam) presentes en 60 genomas de plantas se publicó recientemente por Artur et al. (2019), revelando la expansión de algunas familias en ciertas especies y sugiriendo que la diversificación estructural y funcional de las LEAPs ha contribuido a la adaptación de algunas plantas a ambientes con condiciones hídricas limitadas. Describimos abajo características de tres grupos de LEAPs estructuralmente distintas, las cuales son de interés para este trabajo:
Dehidrinas (Grupo 2). Contienen el dominio PF00257 de Pfam, se caracterizan por su alta hidrofilicidad y se distinguen por la presencia de los siguientes motivos altamente conservados (Battaglia et al. 2008): el segmento-K rico en Lys se encuentra en todas las dehidrinas de una a 11 veces; el segmento-Y se distribuye de una a 35 copias en tándem hacia la región N-terminal de la proteína; un tercer motivo presente en algunas dehidrinas es el segmento-S, rico en Ser. La presencia y ubicación de estos motivos divide estructuralmente a las dehidrinas en cinco subgrupos: K, SK, YSK, YK y KS. Algunas dehidrinas poseen también un segmento-F (Strimbeck 2017, Riley et al. 2019). A la fecha se han caracterizado funcionalmente dehidrinas de diversas especies, describiendo los patrones de abundancia de sus transcritos ante condiciones como sequía, alta temperatura, salinidad y estrés osmótico, y comparando entre variedades susceptibles y tolerantes a sequía, así como en plantas xerófitas. También se ha analizado el efecto de silenciar sus genes o sobre-expresarlos heterólogamente en bacterias o en otras especies vegetales (Shi et al. 2016, Lv et al. 2017, Guo et al. 2019, Cui et al. 2020). Las dehidrinas de A. thaliana como ERD14, COR47, ERD10, LTI45 y RAB18 participan en la tolerancia al frío, aparentemente protegiendo membranas plasmáticas y de cloroplastos (Artus et al. 1996, Puhakainenet al. 2004). Todas ellas parecen localizarse en el citosol (Candat et al. 2014). Los posibles mecanismos mediante los cuales las dehidrinas protegen membranas y enzimas, eliminan especies reactivas de oxígeno, y/o previenen la desnaturalización de ciertas proteínas, evitando la formación de agregados proteicos, han sido revisados por varios autores (Cuevas-Velázquez et al. 2014, Graether & Boddington 2014).
LEAPs atípicas (Grupo 5). Originalmente identificadas en Craterostigma, arroz y soya (Piatkowski et al. 1990, Galau et al. 1993, Maitra & Cushman 1994), las LEAPs atípicas tienen un contenido de aminoácidos hidrofóbicos relativamente alto, pocos aminoácidos con carga iónica y tienen estructura secundaria más definida que otras LEAPs (Singh et al. 2005). Se clasifican en tres subgrupos denominados 5A, 5B, 5C; los cuales contienen los dominios Pfam SMP (PF04927), LEA_3 (PF03242) y LEA_2 (PF03168), respectivamente (Battaglia et al. 2008). Se ha propuesto que, en solución, estas LEAPs adquieren conformación globular, la cual es inestable en altas temperaturas (Singh et al. 2005). Este grupo ha sido menos caracterizado que otras LEAPs.
Grupo 5B (LEA_3).- Pocas LEAPs de este grupo han sido estudiadas. En Arabidopsis, dos de los cuatro loci que codifican LEAP_5B han sido descritas funcionalmente. SAG21/AtLEA5, previene la senescencia y participa en la tolerancia a estrés oxidativo (Mowla et al. 2006, Salleh et al. 2012). AtDI21 se acumula en el proceso de sequía y se regula por ácido abscísico (Gosti et al. 1995). Tres LEAP_5B de Arabidopsis son mitocondriales (Candat et al. 2014). El gen CpLEA5 de Chimonanthus praecox (planta que se desarrolla en ambientes gélidos), sobreexpresado en bacterias, levaduras o plantas, contribuye a la protección contra el frío, salinidad o sequía y previene del daño a membranas artificiales (Liu et al. 2015). La proteína LjIDP1 de Lotus japonicus es intrínsecamente desordenada en solución, pero cambia en condiciones de deshidratación o desnaturalizantes, adoptando una estructura de α-hélice y previniendo la inactivación de enzimas al evitar que formen agregados o pierdan su conformación (Haaning et al. 2008). Recientemente se ha identificado que este grupo, además de contener el dominio Pfam PF03242, se definen por la presencia de un motivo W (Trp) (Singh & Graether 2020) y otros ubicados en las regiones N- y C- terminal.
Grupo 5C (LEA_2).- Esta familia, a pesar de haber sido originalmente clasificadas como “atípicas” por sus características estructurales, se ha reconocido recientemente como la más extendida en los genomas de las plantas (Artur et al. 2019). Contienen el dominio Pfam PF03168 y un motivo distintivo conservado (Hundertmark & Hincha 2008). Las LEAPs_5C se han identificado en diversas especies y sus transcritos se acumulan ante múltiples tipos de estrés (Piatkowski et al. 1990, Galau et al. 1993, Maitra & Cushman 1994, Zegzouti et al. 1997, Kimura et al. 2003, Kim et al. 2005, Wang et al. 2014, Zheng et al. 2019). Estas LEAPs presentan actividad protectora in vitro asociada a salinidad, congelamiento, calor, radiación UV, estrés oxidativo y osmótico (Singh et al. 2005, He et al. 2012, Hu et al. 2019) y confieren tolerancia a estrés ambiental cuando se sobre-expresan de forma heteróloga (Kim et al. 2005, Wang et al. 2014, Zheng et al. 2019). Las LEAPs_5C, ampliamente distribuidas en la naturaleza, se encuentran en algunas especies bacterianas conteniendo el dominio WHy (de Water stress and Hypersensitive response) similar a LEA_2, presumiblemente participando en su tolerancia a la desecación (Ciccarelli & Bork 2005). Las LEAPs_5C de Arabidopsis son citosólicas (Candat et al. 2014) y se ha reportado que en solución son más hidrofóbicas, estructuradas y estables que otras LEAPs del grupo 5, adoptando una conformación αβ con una α-hélice y siete cadenas β que forman dos láminas β antiparalelas (Singh et al. 2005, He et al. 2012). LEAPs_5C recombinantes purificadas protegen in vitro la actividad enzimática de la lactato deshidrogenasa (LDH) durante el proceso de desecación y subsecuente rehidratación (Dang et al. 2014, Hu et al. 2019).
Bases moleculares de la tolerancia ante el estrés abiótico en Agave spp. Muchas especies del género Agave crecen en ambientes áridos (Nobel 1988, Gentry 2003) y se consideran como tolerantes al calor y a la sequía (Nobel & Smith 1983, Ramírez-Tobías et al. 2014, Stewart 2015). Se han descrito las adaptaciones morfofisiológicas que poseen como plantas suculentas para evitar la pérdida excesiva de agua, desde su gruesa cutícula hasta su metabolismo CAM (Nobel & Smith 1983, Nobel & Valenzuela 1987). Sin embargo, a pesar de que durante la pasada década transcriptomas de varias especies de agaves se han secuenciado (Gross et al. 2013, Cervantes-Pérez et al. 2018, Huang et al. 2019, Sarwar et al. 2019), existen pocos estudios enfocados a conocer las bases moleculares de su tolerancia al estrés abiótico (Luján et al. 2009, Deng et al. 2019, Shakeel et al. 2013). Conocer dichas bases permitirá una mejor comprensión de su fisiología a nivel molecular, así como de las estrategias evolutivas de este género; herramientas necesarias para el mejoramiento genético. Es posible hipotetizar diferencias en los patrones de expresión de los genes “efectores” involucrados en conferir tolerancia al estrés abiótico, o bien en las características bioquímicas de proteínas efectoras, como las LEAPs.
De acuerdo al conocimiento existente que identifica a las LEAPs como efectores ubicuos con participación en la tolerancia al estrés abiótico, proponemos que estas proteínas realizan un papel similar en los agaves. Para elucidar si sus propiedades bioquímicas son similares o se han diferenciado respecto a las de otras especies vegetales, en este trabajo identificamos secuencias codificantes para LEAPs a partir de datos transcriptómicos de A. tequilana y se clasificaron con base en sus dominios conservados, verificando la presencia de motivos presentes en proteínas LEA ya caracterizadas. También analizamos con herramientas bioinformáticas sus características moleculares y fisicoquímicas tales como la hidrofilicidad y su propensión al desorden estructural. Adicionalmente evaluamos su similitud y diferenciación evolutiva respecto a LEAPs de otras especies vegetales y describimos el patrón de acumulación de sus transcritos en diferentes órganos de A. tequilana y en respuesta a calor.
Materiales y métodos
Identificación de posibles genes de A. tequilana codificantes de LEAPs. La AgaveDB contiene secuencias parciales de 35,000 transcritos (ESTs del inglés Expressed sequence tags) de A. tequilana (Simpson et al. 2011). Mediante blastx (Altschul et al. 1990) de los ESTs contra la base de datos nr de NCBI, se identificaron aquellos con hits (secuencias similares de otras plantas) presumiblemente codificantes de late embryogenesis abundant proteins (LEAPs); así como los contigs (secuencias consenso) construidos a partir de los clusters (grupos) de ESTs similares entre sí. Los contigs del transcriptoma de seqRNA (Gross et al. 2013) depositado en NCBI (NCBI Resource Coordinators 2016 www.ncbi.nlm.nih.gov) se consultó mediante blastn y tblastn utilizando como query o semilla las secuencias codificantes de LEAPs previamente identificadas en la AgaveDB. Los contigs identificados como posibles genes de LEAPs se compararon mediante blastn contra la base de datos nr/nt de NCBI.
Análisis in silico de las LEAPs identificadas en A. tequilana. Los contigs de A. tequilana con hits a transcritos o loci codificantes de LEAPs, se tradujeron con ExPaSy translate (Gasteiger et al. 2003); los péptidos traducidos se compararon contra la base de datos nt/nr de NCBI mediante blastp, para verificar que corresponden a LEAPs por su similitud con las de otras especies vegetales. Las proteínas similares a las AteqLEAPs con e-value < 10-10 se alinearon usando el software Clustal Omega disponible en el EMBL-EBI (www.ebi.ac.uk/Tools/msa/clustalo). Los alineamientos se editaron usando la herramienta Jalview2 (Waterhouse et al. 2009) y ESPript (espript.ibcp.fr/ESPript/ESPript/index.php).
Para confirmar que las secuencias proteínicas de A. tequilana codifican LEAPs mediante la identificación de dominios, motivos y firmas conservados, se compararon mediante blastp contra las bases de datos de Pfam (El-Gebali et al. 2019), PROSITE (Sigrist et al. 2013, PANTHER (Thomas et al. 2003) e IntePRO (Mitchell et al. 2019), disponibles en el EMBL-EBI (www.ebi.ac.uk/services/proteins). Las dehidrinas se analizaron adicionalmente con el ScanProsite disponible en prosite.expasy.org. Los péptidos de tránsito se predijeron mediante el Phobious del EMBL-EBI.
Las reconstrucciones filogenéticas se realizaron comparando las AteqLEAP contra secuencias de A. thaliana codificantes de LEAPs ortólogas (Hundertmark & Hincha 2008) y con LEAPs homólogas de otras especies vegetales (identificadas mediante blastp contra nr del NCBI), aplicando el método de inferencia Neighbor-Joining, y calculando las distancias evolutivas con el método de corrección de Poisson. Se realizó un test de bootstrap de 1000 réplicas usando el paquete MegaX (www.megasoftware.net). El cladograma estructural se construyó con secuencias homólogas del UniProt/SwissProt identificadas mediante blastp, alineadas en Clustal Omega, y aplicando la matriz de distancias generada de los puntajes por pares en MEGA X.
Las características fisicoquímicas de las LEAPs deA. tequilana(peso molecular, punto isoeléctrico (pI), índice de inestabilidad, índice alifático e hidrofilicidad (GRAVY) se predijeron utilizando el programa ProtParam de Expasy web.expasy.org/protparam. El análisis de carga hidropática se calculó utilizando el programa PONDRwww.pondr.com, distinguiendo entre proteínas ordenadas por la carga media absoluta.
Detección y cuantificación de transcritos de AteqLEAPs. Para comparar los niveles de transcritos de AteqLEAPs en diferentes órganos, tres plantas de A. tequilana Weber var. azul provenientes de la región de Tequila, Jalisco, establecidas en campo (19° 29' 50.2" N; 90° 32' 38.1" W), a partir de hijuelos, por dos años, se colectaron en diciembre del 2018 para diseccionar órganos vegetativos. De cada planta se diseccionó la zona media de tres hojas perimetrales, de tres hojas de la zona intermedia de la roseta y de las hojas no desarrolladas enrolladas dentro del cono central o cogollo, así como el meristemo vegetativo y la zona central del tallo o piña. Las muestras se congelaron con nitrógeno líquido y se mantuvieron en ultracongelación hasta su procesamiento. Las muestras congeladas se molieron, se pesaron y se mezclaron en cantidades iguales para obtener una sola muestra de cada órgano, representativa de las tres plantas.
Para analizar el efecto del calor en los niveles de transcritos de LEAPs, en enero del 2019 se colectaron hojas a partir de tres plantas de A. tequilana, del mismo predio que el experimento anterior. De cada planta se colectaron nueve hojas: tres ubicadas en la zona cercana al cogollo, tres de la zona media de la roseta y tres de la zona perimetral. Tres hojas por planta, representando cada zona de la roseta, fueron tratadas durante dos horas a 25, 45 o 55 oC. Cada tratamiento se aplicó a las hojas de las tres plantas, al mismo tiempo. Se muestreó la zona media de las hojas y se congelaron con nitrógeno líquido. Las muestras de las tres plantas por tratamiento fueron trituradas y posteriormente mezcladas en cantidades iguales, para generar una sola muestra por tratamiento.
El ARN de cada muestra se extrajo con Trizol (Invitrogen, Carlsbad, California USA, cat. No. 15596026), eliminando carbohidratos con el PureLink™ RNA Mini Kit (Ambion ®, Cartsbad, California cat. 12183018A). La concentración y pureza del ARN se evaluaron con el Nanodrop 1000 (Thermo Scientific™, Waltham, Massachusetts). La integridad del ARN se visualizó mediante electroforesis en geles de agarosa (Invitrogen™ cat. 16500500) al 1.2 %. La síntesis de cDNA se realizó con SuperScript III (Invitrogen™ cat. No. 18080093) a partir de 1.6 μg de ARN total por reacción, y las amplificaciones mediante qPCR con IQ SYBRGreen Supermix (BioRad, Hercules, California, cat. 170-8880); conforme lo reportado en Monroy-González & Martínez Hernández (2019), utilizando por reacción 20 pmoles de los oligonucleótidos iniciadores descritos en la Tabla S1. Los iniciadores se diseñaron con base en la secuencia de los contigs aC2782_14/590_7 (AteqLEA5B), aC380_6 (AteqLEA5C), aC891/13_585/4 (AteqDHN1-2) y aC2884_3 (AteqDHN3). Para los controles de expresión constitutiva se diseñaron iniciadores contra genes de poliubiquitina AteqpUBQ y del factor de elongación AteqEF1-α.
Las reacciones de PCR para amplificar los ADNc consistieron de un ciclo inicial de desnaturalización a 95 ºC por 5 min, seguido de 25-30 ciclos de amplificación de: 30 s a 95 ºC, 30 s a la temperatura de alineamiento de cada iniciador reportada en la Tabla S1, 30 s a 72 ºC, finalizando con un ciclo a 72 ºC por 7 min. Para el PCR punto final se utilizaron 25 ciclos de amplificación para AteqLEA5B, AteqDHN1-2 y 30 ciclos para AteqLEA5C, AteqDHN3, AteqpUBQ y AteqEF1-α. Los productos de amplificación se visualizaron por electroforesis en geles de agarosa al 1.2 % usando el marcador de peso molecular de 1 Kb plus (Invitrogen™ cat. 10787018). Para el qPCR los ciclos umbral (Ct) de cada reacción y las temperaturas de disociación (Tm) de los productos amplificados a partir de AteqLEAPs y de los genes control de expresión constitutiva (AteqpUBQ y AteqEF1-α) se determinaron con el iQ5 Optical System Software 2.0. Se incluyeron en paralelo controles negativos sin DNA molde (NTC). La acumulación relativa de los transcritos amplificados por qRT-PCR se analizó a través del método 2-ΔΔCT (Livak & Schmittgen 2001) de la media de los Cts por triplicado de cada muestra normalizada contra la media de los Cts del gen control, se calculó el error propagado del ΔCT y se calibró contra el ΔCT del tejido, gen o condición comparativa. La selección del gen control para normalizar en cada experimento se realizó calculando el 2-ΔCT. El análisis estadístico de la acumulación relativa de los transcritos se realizó con el método de análisis de varianza para comparar múltiples medias ANOVA y TUKEY aplicando una α = 0.05 %.
Resultados
De una búsqueda realizada entre los hits del blastX contra los ESTs de la base de datos AgaveDB, identificamos 10 grupos de ESTs similares entre sí (clusters) cuyas secuencias consenso (contigs) presentan similitud con una LEAP. Para confirmar si estas secuencias tienen similitud con genes o transcritos reportados en otras especies, las comparamos mediante blastn contra la base de datos de nucleótidos del NCBI. En la Tabla 1 se resumen los datos de similitud encontrados del mejor hit identificado para cada contig de A. tequilana. Encontramos que cinco de los 10 contigs de A. tequilana fueron similares a secuencias parciales de LEAPs reportadas en A. angustifolia. Entre ellos, identificamos que el contig de aC2782_14 incluye a un EST (GW667495.1) que reportamos previamente (Martínez-Hernández et al. 2010). Adicionalmente, identificamos dos contigs que fueron altamente similares (E value = 0) a una secuencia genómica de Asparagus officinalis, cuyo mRNA no se ha caracterizado pero contiene un dominio LEA_2. Otros tres contigs fueron similares a secuencias parciales de dehidrinas (LEAPs Grupo 2) reportadas en otra asparagal (Hyacinthus orientalis).
Contig | GenBank accession |
Best Hit | % Cover | E value | % Identity |
---|---|---|---|---|---|
aC3235_35 | MW496331 | Agave angustifolia Marginata LEA mRNA, partial cds KU315011.1 | 50 | 7.00E-56 | 80.82 |
aC2782_14* | MW496332 | Agave angustifolia Marginata LEA mRNA, partial cds KU315011.1 | 54 | 2.00E-50 | 79.34 |
aC708_10 | MW496333 | Agave angustifolia Marginata LEA mRNA, partial cds KU315011.1 | 51 | 3.00E-47 | 79.1 |
aC590_7 | MW496334 | Agave angustifolia Marginata LEA mRNA, partial cds KU315011.1 | 56 | 7.00E-49 | 78.93 |
aC734_6 | MW496335 | Agave angustifolia Marginata LEA mRNA, partial cds KU315011.1 | 55 | 9.00E-48 | 78.51 |
aC380_6 | MW496336 | PREDICTED: Asparagus officinalis uncharacterized (LOC109838014), mRNA XM_020406424.1 |
100 | 0 | 87.72 |
aC746_4 | MW496337 | PREDICTED: Asparagus officinalis uncharacterized (LOC109838014), mRNA XM_020406424.1 |
99 | 0 | 84.89 |
aC891_7_13 | MW496338 | Hyacinthus orientalis dehydrin mRNA, partial cds AY389583.1 | 79 | 5.00E-99 | 72.02 |
aC585_10_4 | MW496340 | Hyacinthus orientalis dehydrin mRNA, partial cds AY389583.1 | 66 | 7.00E-98 | 72.02 |
aC2884_3 | MW496339 | Hyacinthus orientalis dehydrin mRNA, partial cds AY389583.1 | 61 | 2.00E-85 | 71.61 |
El último número del nombre del contig indica el total de ESTs incluidos en ese cluster.
*Este cluster incluye al EST previamente en el GenBank (GW667495.1) por Martínez-Hernández et al.(2010).
Con el fin de corroborar si los 10 distintos contigs de A. tequilana corresponden a transcritos completos codificantes de LEAPs, identificamos sus marcos de lectura abiertos (ORFs) y obtuvimos la secuencia de la proteína codificada mediante traducción in silico. La búsqueda de dominios y motivos conservados presentes en los productos proteínicos codificados por cada contig, mediante comparación contra las bases de datos Pfam, PROSITE, PANTHER e InterPRO del EBI, condujo a la identificación de dominios conservados en tres tipos de LEAPs (Tabla S2). Los primeros cinco contigs de A. tequilana codifican proteínas que contienen el dominio LEA_3, por lo que se clasificaron como LEAPs del Grupo 5B, conforme la clasificación propuesta por Battaglia et al. (2008). Los dos contigs que contienen al dominio LEA_2, se clasificaron como codificantes de proteínas LEA del Grupo 5C. En estos contigs InterPRO identificó también la presencia del dominio WHy. Los últimos tres contigs, ya identificados como similares a genes para dehidrinas (DHN), codifican proteínas que contienen los dominios típicos de dehidrinas reportados en Pfam e InterPRO, así como dos motivos de dehidrinas con aminoácidos altamente conservados reportados en PROSITE. Así, se concluyó que todos los contigs de A. tequilana identificados son transcritos completos y codifican una LEAP que pertenece a los grupos 5B, 5C ó 2 (dehidrina). Los denominamos entonces AteqLEA5(B o C)_#cluster o AteqDHN_#cluster, en donde el número indicado al final del nombre de cada contig (Tabla 1) corresponde a el número de ESTs que conforma cada cluster y es un reflejo de la abundancia de cada tipo de transcrito en el transcriptoma analizado. Por lo que los cinco contigs codificantes de LEAPs 5B conforman el grupo más abundante en la base de datos AgaveDB sumando 72 transcritos secuenciados, seguido de los tres clusters similares a dehidrinas que suman veinte ESTs, en tanto que, los dos clusters similares a LEAPs 5C son los menos abundantes (10 ESTs).
Una búsqueda en los 195,967 contigs de seqRNA de A. tequilana (Gross et al. 2013) mediante blastn y tblastn, utilizando como query los contigs de AteqLEA/DHN y sus secuencias proteínicas correspondientes, condujo a identificar un número relativamente limitado de hits (Tabla S3). La proporción relativa de genes de LEAPs 5B : 5C : DHN observada resultó similar entre ambos transcriptomas. No fue posible en el marco de este trabajo identificar variantes proteínicas de LEAPs 5B, 5C o dehidrinas en ese transcriptoma, ya que los contigs reportados presentan numerosos codones de paro y quimeras. Secuencias parciales idénticas a los contigs encontrados en la AgaveDB también se identificaron en el transcriptoma de seqRNA.
En la Figura 1 se muestra una comparación entre los distintos tipos de LEAPs identificadas en A. tequilana y LEAPs de otras especies reportadas en SwissProt, incluyendo A. thaliana. Las 10 AteqLEAPs conforman tres grupos acorde a sus dominios y clasificación, formando clados con los genes de A. thaliana codificantes de LEAPs que contienen los dominios de Pfam LEA_3, LEA_2 y Dehidrinas (Hundertmark & Hincha 2008). El cladograma muestra que los cinco genes AteqLEA5B se agrupan con dos de los cuatro genes de A. thaliana codificantes de LEAPs 5B (locus At1g02820 y At4g02380), los cuáles son sus posibles ortólogos; pero forman una rama independiente y diversificada. La diversificación de estos genes potencialmente se debe a duplicaciones génicas o genómicas; o bien, corresponden a alelos, ya que los transcritos de A. tequilana provienen de un conjunto de plantas. Los dos genes AteqLEA5C se agrupan con el locus At2g440160 (posible ortólogo), a diferencia de la LEA_5C de C. plantagineum que se agrupa junto con otras dicotiledóneas con los otros dos loci de A. thaliana codificantes de proteínas LEA_5C. La proteína membranal MJ1138 de la arqueobacteria Methanocaldococcus jannaschii contiene un dominio WHy similar a LEA_2 y se separa de las LEAPs de plantas. Los tres genes de dehidrinas de A. tequilana forman un clado con el gen codificante de la DHN1 de O. sativa y cuatro loci de A. thaliana, separándose de los otros seis loci codificantes de dehidrinas en A. thaliana.
Para corroborar si las distintas LEAPs identificadas de A. tequilana contienen los motivos conservados descritos en otras especies vegetales, comparamos su secuencia aminoacídica con proteínas con alta similitud de otras especies, las cuales se identificaron mediante blastp; así como contra secuencias de A. thaliana pertenecientes a estos grupos (Hundertmark & Hincha 2008).
El alineamiento de LEAPs 5B de la Figura 2 muestra que las secuencias de agaves son de menos de 100 aa y contienen zonas conservadas respecto a las LEAPs 5B de otras especies, aunque su porcentaje de identidad es relativamente bajo porque también presentan zonas variables respecto a otras especies. Sin embargo sí contienen el dominio LEA_3 de Pfam, conservan sin ambigüedades el motivo W (Hundertmark & Hincha 2008) y presentan los motivos MAaRS, RRGYA4 y DAELR identificados por Singh & Graether (2020)). Aunque en el motivo DAELR las AteqLEA5B presentan un par de variaciones respecto al consenso reportado, y en el dominio MAaRS cuatro AteqLEA5B carecen de la Ser consenso de la cuarta posición, la cual está sustituida por una Phe. Así mismo, la Lys está sustituida por una Asn y los últimos seis aminoácidos del consenso están ausentes (gap) entre la posición16-17 de las AteqLEA5B respecto a las de otras especies. Las AteqLEA5B, como otras LEAPs de este grupo, presentan un péptido señal transmembranal y mediante phobious se predice que no son citoplásmicas. Las dos argininas de la posición 17-18 corresponden al sitio de corte para escindir el péptido señal.
En la Figura 2 también se observa que los cinco genes AteqLEA5B codifican proteínas muy similares entre sí, en tanto que los contigs aC2782_14 y aC590_7 codifican exactamente la misma secuencia proteínica, aunque difieren entre sí en la secuencia nucleotídica. AteqLEA5B_3235_35 es una proteína casi idéntica a una secuencia parcial de LEAP de A. tequilana previamente reportada (ANF05299.1), pero presenta una sustitución A/T en el aminoácido 34. AteqLEA5B_3235_35 muestra algunas variaciones de aminoácidos respecto a las otras cuatro AteqLEA5B aquí identificadas. Esas variaciones se encuentran también presentes en secuencias reportadas en otros agaves, por lo que parecen corresponder a esta isoforma, como también indica el filograma de la Figura S1. Aunque la identidad proteínica de las AteqLEA5B respecto a las LEA_5B de otras plantas es relativamente baja, el árbol de la Figura S1 muestra que, acorde a la relación filogenética de las especies incluidas, las AteqLEA5B son homólogas a la de A. officinalis y se agrupan con las LEA_5B de otras monocotiledóneas incluyendo asparagales como las orquídeas y comelínidas (palmas, gramíneas y bromelias), separándose de las LEAPs del Grupo 5B de dicotiledóneas, entre las cuáles se encuentran las secuencias de A. thaliana. Aunque magnólidas como Cinnamomum micranthum y Chimonanthus praecox quedaron incluidas en la rama de las monocotiledóneas y las orquídeas no se agruparon con las Asparagales.
Conforme el análisis de la composición de aminoácidos y la predicción de las características fisicoquímicas de las AteqLEA5B (Tabla 2), estas proteínas cumplen con las características descritas para su grupo: una masa molecular menor de 10 KDa, baja abundancia de aminoácidos cargados, relativamente hidrofóbicas (GRAVY Index) y ordenadas (Figura S2A-B); un pI básico. Conforme el índice de inestabilidad calculado a partir de la composición de aminoácidos (Tabla 2), se predice que cuatro AteqLEA5B tienen una estructura estable, pero AteqLEA5B_35 forma una estructura inestable, con o sin péptido de tránsito.
Number of AA | Molecular weight | Theoretical pI | AA+ | AA- | Instability index | Classification | GRAVY | |
---|---|---|---|---|---|---|---|---|
AteqLEA5B_3235_35 | 93 | 9788.11 | 10.37 | 7 | 11 | 48.31 | unstable | -0.167 |
AteqLEA5B_2782_14 | 93 | 9938.37 | 10.14 | 7 | 11 | 38.34 | stable | -0.055 |
AteqLEA5B_708_10 | 93 | 9901.36 | 10.14 | 6 | 10 | 29.37 | stable | 0.015 |
AteqLEA5B_590_7 | 93 | 9938.37 | 10.14 | 7 | 11 | 38.34 | stable | -0.055 |
AteqLEA5B_734_6 | 94 | 9972.44 | 10.14 | 6 | 10 | 29.16 | stable | 0.034 |
AteqLEA5C_380_6 | 316 | 35168.15 | 4.89 | 56 | 41 | 15.98 | stable | -0.338 |
AteqLEA5C_746_4 | 316 | 35203.21 | 4.74 | 59 | 40 | 16.91 | stable | -0.302 |
AteqDHN_891_7_13 | 240 | 26638.69 | 4.94 | 64 | 44 | 52.77 | unstable | -1.111 |
AteqDHN_585_10_4 | 240 | 26606.63 | 4.93 | 64 | 44 | 52.21 | unstable | -1.1 |
AteqDHN_2884_3 | 240 | 26310.23 | 5.03 | 59 | 41 | 52.18 | unstable | -1.07 |
En el caso de las LEAPs del Grupo 5C de A. tequilana, el alineamiento de la Figura 3 mostró que son proteínas de peso molecular relativamente alto (más de 300 aa), muy conservadas, que contienen solo un dominio Pfam de LEA_2 y se identificó el motivo reportado por Hundertmark & Hincha (2008) con variaciones en dos aminoácidos. Este análisis mostró que la proteína de A. thaliana difiere en la región N-terminal, por la inserción de nueve aminoácidos. Aunque son muy similares, las LEAPs del Grupo 5C de monocotiledóneas y dicotiledóneas se separan en dos distintas ramas dentro del filograma de la Figura S3. En cuanto a sus características fisicoquímicas, las AteqLEA5C son distintas a las otras AteqLEA atípicas (5B) ya que tienen pI ácido, un número de aminoácidos cargados relativamente alto y son ligeramente hidrofílicas, menos que las dehidrinas pero más que las AteqLEA5B. Su índice de inestabilidad es el más bajo, por lo que son de estructura estable y ordenadas (Tabla 2, Figura S2C-D).
Las AteqDHN presentaron alta variabilidad respecto a las dehidrinas similares de otras especies, identificadas por blastp (Figura 4). Sin embargo, se identificó el dominio Pfam de dehidrinas (00257), así como los segmentos F, S y tres K. Estos segmentos presentan algunas ambigüedades respecto a los consensos reportados (Battaglia et al. 2008, Riley et al. 2019), por lo que en PROSITE se detectó solo un motivo K. El análisis filogenético (Figura S4) mostró que dos AteqDHN son muy similares entre sí, por lo que pueden corresponder a dos alelos, mientras que la AteqDHN3 corresponde a un segundo gen, todos ellos homólogos a genes de dehidrinas reportados en Asparagales. Este grupo de dehidrinas se separa de los de otras monocotiledóneas, incluyendo comelínidas y gramíneas. Las dehidrinas de dicotiledóneas forman una rama independiente. Conforme lo esperado, las AteqDHN son las AteqLEAPs con el mayor número de aminoácidos cargados, su pI es ácido, son muy hidrofílicas y su estructura se predice como inestable y desordenada (Tabla 2, Figura S2E-F).
Con el fin de determinar si las LEAPs de A. tequilana se expresan en órganos vegetativos funcionalmente diferenciados, evaluamos el nivel de expresión de sus transcritos, mediante qRT-PCR y punto final. Este análisis se realizó con ARN extraído a partir de hojas expandidas de la zona intermedia y externa de la roseta, hojas en desarrollo no fotosintéticas enrolladas dentro del cono central (cogollo), de tallo (piña) y de meristemo colectados a partir de plantas establecidas en campo por dos años (Figura 5). Se establecieron las condiciones de reacción (Tabla S1) y se verificó que para cada reacción se genera un solo producto, midiendo su Tm (Figura S5) y corroborando su tamaño mediante electroforesis. Se identificó al gen AteqpUBQ como control endógeno de expresión constitutiva en este experimento ya que la abundancia media de ese transcrito es similar en todos los órganos evaluados, sin mostrar diferencias estadísticamente significativas (Figuras 6A, S6-A); a diferencia de AteqEF1-α que se acumula en niveles significativamente diferentes en distintos órganos (Figura S6-B).
Al comparar la expresión relativa de cada gen en distintos órganos por RT-PCR punto final (Figura 6A) y por qRT-PCR (Figura S7); así como al determinar la abundancia relativa de los distintos AteqLEAPs en un mismo órgano (Figura 6B-F); encontramos que todos los AteqLEAP se expresaron en todos los órganos analizados, pero a diferente nivel y con un patrón diferencial. En hojas intermedias y externas los AteqLEA5B presentaron un mayor nivel de acumulación de hasta 60 veces más que los transcritos de otras LEAPs (Figuras 6A-C, S7B); pero se expresaron a bajo nivel en otros órganos (Figura 6D-F). Por el contrario, en piña, meristemo y en hojas en desarrollo (cogollo) los transcritos para las dehidrinas, especialmente AteqDHN1-2, fueron los más abundantes, acumulándose de 10 a 20 veces más que los transcritos de otras LEAPs (Figura 6D-F y S7C). AteqDHN3 tuvo un patrón de expresión similar a AteqDHN1-2 pero a más bajo nivel (Figuras 6E-F, S7-D). Los transcritos AteqLEA5C mostraron baja expresión en todos los órganos (Figura 6B-F).
Para evaluar si la expresión de AteqLEAPs se afecta por tratamientos con calor, su acumulación relativa se cuantificó en hojas disectadas sometidas por dos horas a 45 o 55 oC, comparando contra sus niveles de expresión en hojas mantenidas a 25 oC. En este experimento se normalizó contra AteqEF1-α, el cual mostró niveles de acumulación menos variables que AteqpUBQ ante estos tratamientos (Figura S6C-D). En la Figura 7A se observa que los transcritos de AteqLEA5B mantuvieron su alto nivel de acumulación, aún en hojas tratadas a 45 o 55 oC. Mientras que los de AteqDHN1-2, que en esta mezcla de hojas mostraron un nivel similar al de AteqLEA5B a 25 oC, decayeron por efecto del tratamiento con calor, de forma estadísticamente significativa (Figura 7C). AteqLEA5C y AteqDHN3, que son de bajo nivel de expresión en hojas, no mostraron un cambio significativo por efecto del tratamiento con calor (Figura 7B, D).
Discusión
El número de genes y familas de LEAPs identificados en A. tequilana es reducido. La búsqueda dirigida de proteínas LEA en datos transcriptómicos de A. tequilana condujo a la identificación de relativamente pocos genes codificantes de LEAPs, pertenecientes a solo tres de los ocho familias reportadas en Pfam: Grupo 5B (LEA_3), Grupo 5C (LEA_2) y Grupo 2 (Dehidrinas); tanto en la base de datos de ESTs, como en los de seqRNA. En ambos transcriptomas es similar la abundancia relativa de transcritos de los distintos tipos de LEAPs, siendo más abundantes los que codifican proteínas LEA5B, seguidos de los transcritos para dehidrinas y finalmente los de LEA5C, los cuales mostraron el más bajo nivel. Esto resulta contrario a la hipótesis de que este tipo de genes podría ser abundante y diverso en el transcriptoma de los agaves considerando que las LEAPs podrían significar una estrategia evolutiva de protección particularmente diseminada en algunas especies. Para X. viscosa se ha planteado que la sobre-representación de algunos tipos específicos de LEAPs, cuyos miembros, estructuras y funciones se han expandido y diversificado, está evolutivamente asociada con la contribución de estos genes a su adaptación al estrés hídrico (Costa et al. 2017, Artur et al. 2019).
En los genomas de dicotiledóneas como Malus domestica, Glicyne max, Brassica spp. los genes codificantes de LEAPs se han expandido (Artur et al. 2019), alcanzando hasta 242 genes en Gossypium hirsutum (Magwanga et al. 2018). Entre las monocotiledóneas secuenciadas a nivel genómico, las gramíneas presentan una mayor abundancia relativa de genes LEAPs, conteniendo algunas especies como Zea mays y Hordeum vulgare más de 100 genes, mientras que el genoma de Phalaenopsis equestris (asparagal) contiene 69 genes de LEAPs. El limitado número de genes codificantes de LEAPs identificados en A. tequilana y el bajo número de familias génicas observadas sugiere que están subrepresentadas en el transcriptoma analizado, posiblemente porque fue secuenciado a partir de plantas cultivadas, sin signos de estrés. Otra posibilidad es que su participación en la tolerancia de esta especie, adaptada a desarrollarse en condiciones de estrés ambiental, ocurre principalmente mediante tipos específicos de LEAPs, como los aquí identificados. Los análisis genómicos y transcriptómicos han revelado que, si bien el número de genes de LEAPs es extenso en plantas, no todas las LEAPs se expresan en respuesta a estrés abiótico y su patrón de expresión titular es variable (ej: Kimura et al. 2003, Hundertmark & Hincha 2008, Nagaraju et al. 2019). Más aún, muchas LEAPs se expresan solo durante el proceso de desecación en la embriogénesis y no en tejidos vegetativos. Los transcriptomas de agaves actualmente disponibles no incluyen esos tejidos. Un futuro análisis de los genomas de Agave spp. en proceso de ensamble, permitirán corroborar el tamaño y diversidad de las familias génicas de LEAPs en este género.
Si bien una abundancia y participación limitada de las LEAPs en los agaves es inesperada, en otras especies xerófitas como la planta de la resurrección C. plantagineum se ha propuesto que; además de los mecanismos comunes que participan en la tolerancia a la desecación; podrían existir mecanismos moleculares distintos seleccionados evolutivamente por las condiciones limitantes, como los denominados genes restringidos taxonómicamente (TRGs) (Giarola & Bartels 2015). La identificación de otros posibles efectores taxonómicamente seleccionados en Agave spp. ante estrés ambiental, así como de mecanismos reguladores alternos, debe ser considerada.
Subrrepresentación de las LEAPs del grupo 5C (LEA_2) en A. tequilana. Aunque las LEAPs del Grupo 5 fueron denominadas como atípicas debido a sus características bioquímicas diferentes (hidrofóbicas y más estructuradas) (Galau et al. 1993, Battaglia et al. 2008), hoy conocemos que esta familia es la más extendida en los genomas vegetales y se ha propuesto que, a través de duplicaciones recurrentes en tándem se ha diversificado funcionalmente contribuyendo a la adaptación de las plantas a ambientes con limitación de agua (Artur et al. 2019). Además, LEAPs que contienen al dominio WHY (Water stress and Hypersensitive response), similar al LEA_2, se encuentran en bacterias y arqueobacterias en las cuales puede haberse adquirido recientemente por transferencia horizontal (Mertens et al. 2018).
Sin embargo, no muchas LEAPs 5C de plantas se han caracterizado funcionalmente. Por ejemplo, transcritos con dominio LEA_2 de X. viscosa mostraron respuesta a la sequía, incrementando sus niveles rápidamente ante este tratamiento. Después de la rehidratación, los transcritos disminuyeron. Se sugiere que una función de éstas y otras LEAPs, con comportamiento similar, está relacionada con mantener la homeostasis celular durante la deshidratación (Costa et al. 2017). En Ipomoea pes-caprae L., planta halófita marina, el nivel de transcritos de una LEA_2 se incrementa por tratamientos con sal, choque osmótico, oxidantes, congelamiento y ácido abscísico. La sobre-expresión de este gen incrementa la tolerancia a estrés salino y sequía en plántulas de A. thaliana. Se sugiere que este gen está involucrado en la respuesta de la planta mediando la homeostasis hídrica o como un scavenger de las especies reactivas de oxígeno (Zheng et al. 2019). Genes codificantes de las LEAPs 5C de arroz también han mostrado participar en la tolerancia a estrés abiótico (He et al. 2012, Hu et al. 2019).
Aunque las LEAPs del grupo 5C están altamente conservadas en la naturaleza, se han multiplicado ampliamente en plantas y al menos algunas están asociadas a una función protectora contra estrés ambiental; en A. tequilana solo detectamos transcritos de dos isoformas de AteqLEA5C, con bajo nivel de acumulación en los tejidos evaluados y sin respuesta al tratamiento por calor. La baja diversidad y expresión observada sugiere, inesperadamente, poca relevancia de esta subfamilia en A. tequilana o bien, una función específica en órganos distintos a los estudiados. Sin embargo, en otras monocotiledóneas como sorgo y arroz las LEA5C sí se expresan en tejidos vegetativos (He et al. 2012, Nagaraju et al. 2019). La falta de inducción de las AteqLEA5C con el tratamiento con calor contrasta con la inducción observada en miembros de esta familia en otras plantas, por lo que la participación de las AteqLEAP5C bajo otras condiciones de estrés ambiental como sequía o frío será analizada.
Potencial papel de las dehidrinas SK3 de A. tequilana protegiendo tejidos no fotosintéticos en desarrollo, de reserva y meristemáticos. Las dehidrinas, LEAPs altamente hidrofílicas e intrínsecamente desordenadas, conforman el grupo de LEAPs más estudiado en diversas especies (ej: Puhakainen et al. 2004, Hughes et al. 2013, Cuevas-Velázquez et al. 2014, Graether & Boddington 2014, Riley et al. 2019, Cui et al. 2020). DHN1 y WCOR410 son dehidrinas SK3 identificadas en Oryza sativa y Triticum aestivum, inducibles por frío (Guo et al. 1992, Lee et al. 2005), homólogas a la cold-regulated COR47 de A. thaliana (At1g20440). Conforme lo reportado en UniProtKB, DHN1 se expresa en panícula y también se induce por sequía, salinidad y ácido abscísico; mientras que WCOR410 se expresa en raíz, espigas y hojas durante la aclimatación a frío y se induce en variedades tolerantes a congelamiento. Las dehidrinas de A. tequilana son homólogas a las proteínas WCOR410, por lo que su respuesta a frío deberá ser evaluada.
Las proteínas AteqDHN identificadas contienen un segmento-S y tres K. Sin embargo, dos de sus segmentos-K presentan variaciones respecto a la firma identificada en PROSITE y al consenso reportado por Battaglia et al. (2008). Considerando que las sustituciones aminoacídicas observadas en el segmento-K de las AteqDHN, respecto al consenso, se conservan en otras monocotiledóneas, proponemos que éstas pertenecen al tipo SK3. Sin embargo, es importante considerar que las sustituciones observadas en los segmentos K y F podrían afectar sus funciones bioquímicas, ya que estos segmentos poseen propensión a formar α-hélices amfipáticas las cuáles se asocian a la función de las dehidrinas para la crioprotección de membranas artificiales, a las cuáles se unen de forma fosforilación-dependiente (Hughes et al. 2013, Candat et al. 2014, Strimbeck 2017). También se identificó en las AteqDHN una secuencia similar al segmento-F (Strimbeck 2017, Riley et al. 2019), el cual se reporta presente en dehidrinas específicamente inducidas por estrés abiótico como sequía, calor y salinidad (Artur et al. 2019).
Los transcritos de las dos isoformas de AteqDHN aquí identificadas mostraron mayor nivel de expresión en tallo y meristemo vegetativo que las otras AteqLEAPs. Esta expresión constitutiva observada en órganos vegetativos de A. tequilana es atípica, respecto a los patrones de expresión observados en otras plantas. AteqDHN1-2 son además los más expresados en las hojas en desarrollo, enrolladas dentro del cono central (cogollo). En los agaves, el meristemo y las hojas del cogollo permanecen viables aún después de estar varios meses sin riego, en tanto que las hojas expandidas externas pierden viabilidad. Ante el riego, las hojas del cogollo se despliegan formando hojas desarrolladas, con capacidad fotosintética. La expresión de las AteqDHN en estos órganos sugiere que pueden participar en la protección de la viabilidad de células meristemáticas y en proceso de desarrollo, para asegurar la supervivencia de la planta mediante la reactivación de estos tejidos, aún después de etapas prolongadas de estrés hídrico. Este hipótesis es coincidente con lo previamente reportado por Luján et al. (2009), quien mostró que las heat-shock proteins (HSP) pequeñas se expresan en altos niveles en las hojas del cono central, tanto a temperatura ambiente como bajo tratamientos con calor, sugiriendo que dicha expresión constitutiva es parte de las estrategias moleculares que protegen al meristemo apical vegetativo (SAM) de daño por altas temperaturas. Aunque AteqDHN1-2 disminuyó su nivel de acumulación en hojas tratadas con calor y AteqDHN3 no modificó sus bajos niveles de expresión en dicho tejido, se requiere evaluar la respuesta de estas dehidrinas ante calor en cogollo y meristemo apical.
Otra explicación para el alto nivel de expresión de dehidrinas detectado en estos tejidos es que en las células meristemáticas y en desarrollo, al encontrarse en proceso de división acelerado y de construcción de estructuras celulares y membranas, requieran la presencia de dehidrinas para ensamblar o proteger las proteínas estructurales y metabólicas implicadas en los procesos de división y diferenciación celular, independientemente de las condiciones ambientales. La alta expresión de los transcritos de AteqDHNs en la piña (tallo); el cual en los agaves es un tejido especializado en la acumulación de carbohidratos tipo fructanos; puede estar relacionada con el alto potencial osmótico que pueden tener esas células y con la protección de enzimas metabólicas en este órgano de reserva.
Las LEAP_5B (LEA_3) podrían jugar un papel relevante en la protección de tejidos fotosintéticos en A. tequilana. Las LEAPs de este grupo, por su relativa escasez en los genomas y por su temprana categorización como atípicas, han sido poco estudiadas y descritas en la literatura. Las AteqLEA5B aquí analizadas conservan, junto con las LEAPs_5B de otras monocotiledóneas, el motivo W identificado en A. thaliana por Hundertmark & Hincha (2008). También se identificaron otros motivos estructurales reportados por Singh & Graether (2020), lo que conduce a clasificarlas dentro del subgrupo MAaRS-1W, una de las estructuras más comunes en LEA5B de otras especies. Las AteqLEA5B son hidrofóbicas, ordenadas y con estructura estable, por lo que cumplen con todos los parámetros fisicoquímicos reportados para el subgrupo MAaRS (Singh & Graether, 2020). Interesantemente para la AteqLEA5B_35, que es el miembro de esta familia génica con mayor nivel de expresión, se predice una estructura inestable. Tal diferencia radica en pocos cambios de aminoácidos entre sus secuencias; en particular notamos que en las cuatro AteqLEA5B estables una Phe sustituye a la Ser consenso del dominio MAarS y una Val sustituye al Glu en el motivo del C- terminal. El péptido señal que se predice en el N-terminal de las AteqLEA5B es congruente con los reportes experimentales que muestran que éstas LEAPs son mitocondriales (Candat et al. 2014). El motivo MAaRS de las AteqLEA5B, forma parte del péptido señal, por lo que sus variaciones respecto al consenso podrían afectar la localización subcelular de las AteqLEA5B.
Los cinco genes de AteqLEA5B aquí identificados codifican solo tres distintas proteínas, lo cual sugiere que dos pares de estos genes son alelos de un mismo gen, o bien que son duplicaciones génicas que están divergiendo. Aunque las AteqLEA5B contienen todos los motivos conservados, su secuencia proteínica es de homología relativamente baja contra LEAPs 5B de otras plantas, incluida la de A. officinalis; mostrando que estas LEAPs han divergido en A. tequilana.
En cuanto a la función de las LEAPs del Grupo 5B, SAG21 (senescence-associated gene), proteína con dominio LEA_3 de A. thaliana también denominada AtLEA5, ha sido funcionalmente caracterizada y se expresa en tejidos vegetativos antes de la senescencia y en polen, se induce por estrés oxidativo, ácido abscícico, deshidratación, frío, salinidad y por estrés biótico (Mowla et al. 2006, Salleh et al. 2012). Una LEAP_5B de arroz (OsLEA3) también se induce por ácido absícico y ante condiciones de salinidad en variedades tolerantes (Moons et al. 1997). En varias especies de Agave spp., Tamayo-Ordóñez et al. (2016) reportó el incremento en la expresión relativa de LEAPs ante periodos de 15 o 30 días bajo condiciones de alta salinidad o temperatura. Aquí mostramos que dichas LEAPs son ortólogas a AteqLEA5B_35.
Nuestros resultados confirman que las AteqLEA_5B, que son las LEAPs más abundantes en los transcriptomas analizados, tienen mayor nivel de expresión que otras LEAPs, particularmente en hojas expandidas, plenamente funcionales y sin signos de estrés. Dicho nivel de expresión se mantiene al ser tratadas con calor, sugiriendo producción o estabilidad del transcrito aún bajo condiciones en las que los transcritos de AteqpUBQ y AteqDHN1-2 se ven disminuidos. Esta expresión alta y constitutiva sugiere que las AteqLEAPs_5B tienen un papel relevante en la protección preventiva de hojas fotosintéticamente funcionales de A. tequilana.
Conclusiones
Tomando en conjunto los resultados aquí obtenidos, y considerando que los patrones de expresión observados a nivel transcrito se mantienen a nivel proteína, sugerimos que las AteqLEA5B atípicas (LEA_3) y las dehidrinas, en particular AteqLEA5B_35 y AteqDHN1-2, podrían tener una función evolutivamente seleccionada en A. tequilana, expresándose de forma constitutiva en tejidos vegetativos diferenciales como los fotosintéticos o meristemáticos, en desarrollo y de almacenamiento; respectivamente. La expresión constitutiva de estas AteqLEAPs, forma parte de las estrategias moleculares que confieren al agave una protección preventiva tipo “primed state”; como se ha sugerido para las plantas de resurrección, las cuales parecen estar preparadas expresando constantemente los genes codificantes de las enzimas que participan en la biosíntesis de azúcares protectores y antioxidantes, así como genes de proteínas de defensa como las LEAPs (Bechtold 2018). El aislamiento de las AteqLEA5B nativas y la evaluación de sus propiedades bioquímicas in vitro, el análisis del efecto de su expresión heteróloga en otros organismos, y la localización subcelular de las LEAP in vivo, contribuirán a definir su función en los agaves.
Material suplementario
El material suplementario de este artículo puede ser descargado de esta liga: https://doi.org/10.17129/botsci.2861