Introducción
El trigo harinero, es el cereal más cultivado en el mundo, por su adaptación exitosa a diferentes condiciones agroecológicas (Li et al. 2020). Se clasifica en dos hábitos de crecimiento, primavera o invierno, según sus patrones de floración bajo diversos rangos de temperatura ambiental (Trevaskis et al. 2007, Zhang et al. 2008). Dicha característica fenológica asociada con el proceso de vernalización, se encuentra determinada por los genes Vrn, los cuales en interacción con genes del fotoperíodo (Ppd) y genes que controlan la tasa de desarrollo (Eps) regulan la floración oportuna bajo condiciones estacionales óptimas (Whittal et al. 2018, Khumalo et al. 2017).
En algunas especies de plantas de clima templado el requisito de vernalización es indispensable para la expresión de activadores florales después de un periodo prolongado de temperaturas frías (Dixon et al. 2019, Li et al. 2020). En este sentido, cuatro genes mayores denominados Vrn1, Vrn2, Vrn3 y Vrn4 han sido relacionados con la respuesta a la vernalización en diferentes cultivares de trigo (Yan et al. 2004, 2006, Trevaskis et al. 2003, Danyluk et al. 2003, Kippes et al. 2015, Nazim et al. 2018). Particularmente, se ha demostrado que variaciones alélicas en el gen Vrn1, cuyas copias homologas (Vrn-A1, Vrn-B1 y Vrn-D1) se ubican en los cromosomas 5A, 5B y 5D, respectivamente, son las responsables de la supresión del requisito de vernalización, ya que la presencia de alelos dominantes en tan solo un loci es suficiente para conferir el hábito de crecimiento primaveral (Li et al. 2020).
La caracterización de los genes Vrn ha permitido un avance significativo al entendimiento de la regulación genética del proceso de vernalización de los cereales (Kippes et al. 2015). Sin embargo, algunos estudios realizados en líneas endogámicas de cebada (Saisho et al. 2011) y mutantes de trigo tetraploide (Chen y Dubcovsky 2012) proporcionan evidencia sobre la contribución de genes desconocidos en la diferenciación de los dos hábitos de crecimiento y en el proceso de floración (Trevaskis 2015). Considerando lo anterior y dada la importancia de la vernalización en la adaptación a entornos específicos de los cereales (Goncharov 2003), esta investigación tuvo como objetivo estudiar la asociación entre marcadores SNP’s y el hábito de crecimiento en colectas de T. aestivum a través de un estudio de asociación de genoma completo (GWAS), con la finalidad de localizar regiones que tengan una posible relación funcional con dichos patrones.
Materiales y métodos
Obtención de datos de hábito de crecimiento
Se utilizaron los datos de pasaporte de 174 553 colectas del banco de germoplasma de CIMMYT, cada entrada de los datos de pasaporte contiene una URL pública que permite acceso a información adicional de cada colecta. A través del desarrollo de código escrito en el lenguaje R y con ayuda del paquete “rvest” v0.3.6 (Wickham 2020), se programó el acceso automático a cada URL para la búsqueda de patrones que indicaran la presencia de información de hábito de crecimiento, y su categoría como cultivo de primavera o de invierno y que fueran Triticum aestivum. La búsqueda arrojó un total de 20 380 colectas con información sobre hábito de crecimiento. El proceso automático se validó a través de una búsqueda manual de una muestra de 100 colectas dentro de dicho conjunto, y se verificó una concordancia del 100% en la determinación de las categorías de primavera o invierno.
Obtención y limpieza de datos genotípicos
La información molecular fue obtenida a partir de una tabla de datos en formato HapMap con información de 45 871 colectas del banco de germoplasma de trigo del Centro Internacional de Mejoramiento de Maíz y Trigo (CIMMYT), las cuales fueron genotipificadas con tecnología DArTseq con 86 683 loci SNP en el CIMMYT. Los datos se filtraron para incluir solo colectas de Triticum aestivum caracterizadas por su hábito de crecimiento. Se seleccionaron solo marcadores informativos (polimórficos para las accesiones seleccionadas) con una tasa de datos perdidos del 10%. Se detectó la ubicación física de cada marcador con datos obtenidos por BLAST, y se mantuvieron solo aquellos que podían ser localizados de una manera no ambigua en el genoma de trigo. Bajo este filtrado de datos, se obtuvo un conjunto con 7 956 colectas caracterizadas con 25 681 loci de SNP, en un formato HapMap, los cuales dieron cobertura amplia a los 21 cromosomas de T. aestivum. Las colectas seleccionadas tienen diverso origen geográfico y son una mezcla con diferente nivel genético, ya que se consideraron desde variedades criollas hasta líneas mejoradas.
Análisis exploratorio
Los datos se exploraron mediante pruebas exactas de Fisher para todos los loci, en cuanto a su asociación con el hábito de crecimiento. Se detectó un número considerable de asociaciones bajo el criterio de Bonferroni para un valor p = 0.01, por lo que se procedió a realizar las pruebas adecuadas para el GWAS.
Análisis de asociación
Considerando las dimensiones del conjunto de datos, además del tiempo y demanda computacional que implica realizar un número muy grande de pruebas estadísticas, una por cada SNP's genotipificado, los GWAS se ejecutaron con un código de lectura de SNP’s fragmentado para múltiples archivos. Mientras que los cálculos de parentesco y componentes principales (CP) se estimaron bajo un esquema de muestreo aleatorio. Para ello, la tabla de datos genotípicos HapMap fue dividida en 21 archivos, uno para cada cromosoma. Los datos fenotípicos de las accesiones fueron incluidos como un archivo independiente con el hábito de crecimiento clasificado en 0 y 1, donde 0 son las accesiones de hábito invernal y 1 las de primavera.
Se definieron dos enfoques de estudio para determinar la asociación: 1) El de Unificación de Probabilidad Circulante de Modelo fijo y aleatorio (FarmCPU) (Liu et al. 2016) y 2) BLINK (Huang et al. 2018), el cual está basado en información bayesiana. El procesamiento con estos dos enfoques se realizó con el paquete GAPIT (Herramienta Integrada de Predicción y Asociación del Genoma) versión 3.0 de R (Lipka et al. 2012). Estos enfoques se caracterizan por usar iteraciones para seleccionar un conjunto de marcadores asociados con un rasgo de interés. Los marcadores asociados se ajustan como covariables para probar los marcadores en todo el genoma, uno a la vez.
La estructura poblacional se determinó automáticamente aplicando un análisis de componentes principales (ACP) al ejecutar cada GWAS. Con las gráficas de componentes principales se identificaron colectas fuera de tipo, con posibles errores de clasificación, las cuales fueron depuradas del conjunto de datos genotípicos. Los gráficos de ACP se generaron con el paquete “ggplot2” v3.3.2 de R (Wickham 2009).
Los análisis de asociación bajo los modelos mencionados se ejecutaron nuevamente con los datos depurados (7 757 colectas y 25 681 marcadores SNP’s). Para este efecto, la estructura poblacional se ajustó mediante los primeros cinco componentes principales. Los marcadores significativos en cada modelo fueron seleccionados considerando su valor p ajustado por la tasa de falso descubrimiento (FDR) a un alfa de 0.01.
Mapeo de marcadores
Mediante el uso de la herramienta BLAST y las secuencias de nucleótidos de cada SNP significativo se corroboró su ubicación física con base en el genoma de referencia de trigo IWGSC_refseqv1.0 (IWGSC, 2018) publicado en la base de datos de Ensembl Plants (2021). Las posiciones físicas fueron seleccionadas con base en los alineamientos con más altos porcentajes de identidad (> 90%). Con la información obtenida se elaboró una representación esquemática del mapa físico del trigo harinero mediante el paquete “LinkageMapView” v2.1.2 de R (Ouellette et al. 2018). En el mapa se incluyeron genes de vernalización, fotoperíodo y precocidad perse, reportados en bases de datos. Una vez elaborado el mapa físico se identificaron las regiones genómicas conformadas en bloques de asociación (BA).
Análisis bioinformático
Las regiones genómicas conformadas en BA fueron sometidas a un análisis bioinformático para conocer las propiedades funcionales de las mismas. Para ello, se exploró a detalle cada región genómica en la base de datos de Ensembl Plants con la finalidad de identificar posibles genes candidatos. La identificación de proteínas funcionales codificadas por genes candidatos se consultó en la base de datos UniProt (2021)
Resultados
Análisis de asociación del genoma completo
Considerando los valores p ajustados por la tasa de falso descubrimiento bajo dos enfoques de análisis de asociación (FarmCPU y BLINK) se identificó un conjunto de 593 marcadores SNP’s con una asociación altamente significativa (0.01) al hábito de crecimiento. Del conjunto total de marcadores elegidos, el modelo FarmCPU fue el más abundante con respecto al número de marcadores asociados, con un aporte de 518 marcadores SNP’s (Figura 1). La mayor presencia de estos marcadores se observa en los cromosomas 2A, 2B, 2D, 3A, 3B y 5A con más de 30 SNP’s en cada uno. Por el contrario, el modelo BLINK aportó únicamente 144 marcadores, con una mayor incidencia en los cromosomas 2B y 2D, con 16 SNP’s cada uno (Figura 2). Algunos marcadores SNP’s fueron coincidentes en los resultados de ambos modelos. En la Tabla 1 se presentan los resultados GWAS para 70 marcadores SNP’s conformados en bloques de asociación.
Crom | SNP | Valor P | MAF | Posición Física (pb) | BA |
---|---|---|---|---|---|
1D | 109374796|F|0-9:C>T-9:C>T | 1.25E-03 | 1.04E-02 | 468309273 | 1 |
108513969|F|0-11:G>A-11:G>A | 5.74E-03 | 1.68E-02 | 469542771 | ||
108713509|F|0-41:T>C-41:T>C | 6.33E-05 | 4.16E-02 | 470220690 | ||
108147322|F|0-16:A>G-16:A>G | 7.07E-04 | 3.73E-02 | 470523298 | ||
109349553|F|0-34:C>G-34:C>G | 4.27E-06 | 3.40E-02 | 470523363 | ||
109349552|F|0-19:C>A-19:C>A | 1.38E-04 | 3.69E-02 | 470535921 | ||
2A | 108256603|F|0-47:T>G-47:T>G | 4.09E-03 | 4.50E-01 | 58386894 | 2 |
109340887|F|0-22:C>T-22:C>T | 2.01E-03 | 4.42E-01 | 59120190 | ||
108620226|F|0-51:G>A-51:G>A | 5.18E-06 | 2.13E-02 | 59334130 | ||
109372697|F|0-26:C>G-26:C>G | 5.55E-03 | 2.13E-01 | 745524854 | 3 | |
109118300|F|0-28:T>C-28:T>C | 5.79E-03 | 4.91E-01 | 150710793 | 4 | |
108926834|F|0-68:T>G-68:T>G | 1.37E-03 | 4.91E-01 | 150985370 | ||
109302969|F|0-60:C>T-60:C>T | 4.85E-03 | 4.70E-01 | 151895514 | ||
108203258|F|0-9:A>G-9:A>G | 5.46E-03 | 2.28E-01 | 152503627 | ||
2B | 108144780|F|0-66:T>C-66:T>C | 3.42E-03 | 1.60E-01 | 169861838 | 5 |
107873878|F|0-33:A>C-33:A>C | 2.73E-03 | 2.53E-01 | 170086991 | ||
108303724|F|0-60:G>C-60:G>C | 6.49E-03 | 2.44E-01 | 170781731 | ||
2D | 108939717|F|0-34:G>T-34:G>T | 7.21E-04 | 4.84E-01 | 748982898 | 6 |
109318254|F|0-49:A>G-49:A>G | 8.43E-03 | 1.98E-01 | 749044179 | ||
109486206|F|0-29:G>C-29:G>C | 3.29E-03 | 1.90E-01 | 749922381 | ||
109355990|F|0-35:T>C-35:T>C | 2.18E-04 | 1.92E-01 | 750002860 | ||
109136240|F|0-18:C>T-18:C>T | 2.91E-05 | 1.20E-01 | 30934992 | 7 | |
108547082|F|0-63:A>G-63:A>G | 2.95E-03 | 1.26E-01 | 31502743 | ||
109067136|F|0-25:T>C-25:T>C | 9.70E-03 | 1.33E-01 | 31502808 | ||
109232275|F|0-40:A>G-40:A>G | 9.75E-03 | 4.38E-03 | 545940420 | 8 | |
109545052|F|0-31:C>G-31:C>G | 1.99E-03 | 3.37E-02 | 547286664 | ||
109545052|F|0-28:G>T-28:G>T | 9.99E-03 | 3.71E-02 | 547559641 | ||
109235294|F|0-10:G>C-10:G>C | 2.90E-03 | 1.93E-01 | 615469335 | 9 | |
109486206|F|0-24:G>C-24:G>C | 3.26E-03 | 1.87E-01 | 615503378 | ||
108800261|F|0-24:C>G-24:C>G | 2.27E-03 | 2.24E-01 | 615943480 | ||
109098245|F|0-58:A>G-58:A>G | 6.03E-03 | 1.97E-01 | 616526082 | ||
108144213|F|0-30:G>A-30:G>A | 1.13E-03 | 2.07E-01 | 618071961 | ||
109137337|F|0-32:C>A-32:C>A | 5.22E-03 | 1.97E-01 | 618826852 | ||
109153060|F|0-47:C>A-47:C>A | 6.94E-03 | 2.13E-01 | 618828092 | ||
109068785|F|0-19:C>A-19:C>A | 2.51E-04 | 2.85E-02 | 620160840 | ||
108145366|F|0-36:G>A-36:G>A | 6.41E-03 | 8.27E-02 | 620270317 | ||
3B | 107697013|F|0-24:A>G-24:A>G | 3.60E-03 | 4.25E-01 | 123356856 | 10 |
109241628|F|0-16:A>C-16:A>C | 9.99E-03 | 4.45E-01 | 124354979 | ||
108085036|F|0-61:T>G-61:T>G | 7.68E-03 | 4.79E-01 | 124817091 | ||
109256730|F|0-63:C>G-63:C>G | 3.77E-03 | 2.67E-01 | 795329079 | 11 | |
108713853|F|0-12:G>C-12:G>C | 3.18E-03 | 2.85E-01 | 795429435 | ||
107877816|F|0-46:A>C-46:A>C | 1.20E-04 | 2.87E-01 | 796008897 | ||
4A | 108994529|F|0-6:T>C-6:T>C | 1.92E-03 | 9.39E-02 | 615181053 | 12 |
108994530|F|0-37:T>A-37:T>A | 3.89E-03 | 9.08E-02 | 615181053 | ||
108476242|F|0-11:G>C-11:G>C | 8.39E-03 | 1.30E-02 | 616934964 | ||
109364118|F|0-8:C>T-8:C>T | 4.86E-03 | 3.68E-01 | 658343324 | 13 | |
109193592|F|0-14:A>T-14:A>T | 3.22E-04 | 4.72E-01 | 659678760 | ||
108434554|F|0-15:T>G-15:T>G | 5.74E-03 | 4.77E-01 | 660455556 | ||
107881764|F|0-40:T>G-40:T>G | 1.12E-03 | 3.26E-01 | 661569379 | ||
4B | 108998096|F|0-43:C>A-43:C>A | 1.67E-03 | 1.41E-01 | 649577977 | 14 |
109229236|F|0-17:C>T-17:C>T | 2.33E-04 | 5.52E-02 | 650880267 | ||
109229237|F|0-49:T>C-49:T>C | 1.19E-03 | 4.15E-02 | 650883267 | ||
109222860|F|0-60:C>T-60:C>T | 4.10E-03 | 3.87E-02 | 653001809 | ||
5A | 109187296|F|0-15:T>C-15:T>C | 1.61E-04 | 1.81E-01 | 461231162 | 15 |
109208559|F|0-9:T>C-9:T>C | 2.99E-04 | 3.47E-01 | 461899837 | ||
108587064|F|0-68:C>A-68:C>A | 1.25E-04 | 4.24E-01 | 581488583 | 16 | |
108957420|F|0-65:G>A-65:G>A | 5.72E-05 | 4.87E-01 | 582636444 | ||
108142772|F|0-28:G>T-28:G>T | 4.59E-10 | 3.91E-01 | 586669360 | 17 | |
108440456|F|0-50:C>G-50:C>G | 1.60E-19 | 2.92E-01 | 588401400 | ||
109266488|F|0-41:G>A-41:G>A | 6.53E-04 | 1.56E-01 | 588761898 | ||
107702923|F|0-64:G>C-64:G>C | 1.40E-04 | 4.64E-01 | 589287593 | ||
6B | 109077677|F|0-39:G>A-39:G>A | 3.42E-03 | 4.13E-03 | 644135224 | 18 |
109441349|F|0-64:G>A-64:G>A | 3.45E-03 | 8.12E-03 | 645483651 | ||
109137306|F|0-50:T>G-50:T>G | 1.55E-03 | 3.74E-03 | 645537586 | ||
7B | 109078487|F|0-20:G>A-20:G>A | 9.70E-04 | 4.90E-01 | 640866076 | 19 |
109127303|F|0-32:A>C-32:A>C | 2.90E-03 | 4.75E-01 | 640905664 | ||
109568141|F|0-23:A>G-23:A>G | 3.33E-03 | 1.31E-01 | 641806854 | ||
7D | 108550833|F|0-50:G>T-50:G>T | 4.56E-05 | 7.59E-02 | 606323492 | |
108884325|F|0-11:C>G-11:C>G | 3.73E-04 | 6.83E-02 | 607228637 | 20 | |
108201673|F|0-12:G>A-12:G>A | 1.89E-03 | 7.33E-02 | 607297673 |
Crom = Cromosoma; P = valor de p al 0.01 ajustado por tasa de falso descubrimiento (FDR); MAF = frecuencia mínima de alelos. El símbolo E en los valores de P y MAF indica x10n.
La estructura de la población estimada a través de cinco componentes principales reveló la estrecha base genética de los trigos de tipo invernal con 938 colectas, en comparación con las 6 819 de primavera (Figura 3). El patrón de dispersión puede ser explicado en gran medida por la variabilidad geográfica y genética a la que pertenecen las accesiones bajo estudio. Sin embargo, se puede diferenciar con claridad como las colectas de hábito invernal pertenecen a un conjunto compacto, el cual fue conformado en su mayoría con cultivares y líneas mejoradas.
Mapeo de marcadores
El mapa físico de los marcadores SNP’s asociados con el hábito de crecimiento reveló que 70 de estos formaban BA en 11 cromosomas (Figura 4 y 5). De los bloques mencionados, dos comparten cercanía genómica con un gen de vernalización (Vrn-A1) ubicado en el cromosoma 5A y otro con un gen de fotoperíodo (Ppd-D1) del cromosoma 2D. También se observaron 3 marcadores SNP’s (109087597|F|0-9:A>T-9:A>T - 2A, 09271053|F|0-12:A>G-12:A>G - 5D y 109533531|F|0-29:A>G-29:A>G - 7B) cercanos a la regiones genómicas de los genes Ppd-A1 (fotoperíodo), Vrn-D1 y Vrn-B3 (vernalización). Los BA con mayor número de marcadores se ubicaron en regiones genómicas presentes en los brazos largos de los cromosomas 1D (468309273-470535989 pb), 2B (748982899-750002913 pb), 2D (615469335 -620270385 pb), 4A (658343324-661569447 pb), 4B (649577977-653001877 pb) y 5A (586669360-589287661 pb). El SNP 109372697|F|0-26:C>G-26:C>G (745524854 pb) ubicado en el cromosoma 2A es coincidente con regiones seleccionadas en los BA de los cromosomas 2B y 2D.
Análisis bioinformático
Las regiones genómicas conformadas por los BA en los distintos cromosomas fueron exploradas a detalle en las bases de datos de Ensembl Plants y UniProt. La información bioinformática de cada BA muestra 20 regiones genómicas con información relevante de genes y proteínas con posible funcionalidad en la determinación del hábito de crecimiento (Tabla 2). Estos resultados revelan la abundancia de proteínas de dominio quinasas en muchos BA, como Quinasas de serina y treonina (RSTK), Receptores de serina y treonina (RLK), Quinasas dependiente de ciclina N (RSTK), Diacilglicerol quinasa (DGK) y Tiamina pirofosfoquinasa (TPK). También se notaron algunas proteínas de dominio de caja, como Homeobox, F-box, U-box y MADS-box, esta última vinculada con el gen de vernalización Vrn1 del cromosoma 5A. Se reportan dos genes ortólogos de Arabidopsis thaliana (SEP2 y EDA15) coincidentes con BA ubicados en los cromosomas 2B y 5A. En algunos BA se identificaron los genes TthV (1D), DREB2 (2B), GRF4-D1 (2D) y D1-DWARF1 (2D), reportados en bases de datos para T. aestivum.
BA | Ensembl Plants | UniProt-Proteína | ||
---|---|---|---|---|
Genes Asociados | ID | Dominio | Función Biológica | |
1 | TraesCS1D02G404300 | Q56TP4 | XTH | Pared celular de tejidos en crecimiento. |
TraesCS1D02G405600 | Q05806 | TTHV | Respuesta de defensa. | |
TraesCS1D02G407600 | A0A1D5SRX7 | CytB561 | Respuesta al déficit hídrico y exceso de luz. | |
TraesCS1D02G404400 | A0A1D6RG09 | ARF | Crecimiento y desarrollo celular. | |
TraesCS1D02G405100 | A0A341PSZ5 | F-box | Respuesta de defensa hormonal y estrés abiótico. | |
TraesCS1D02G406900 | A0A1D5SWV6 | Homeobox | Procesos de desarrollo y respuesta hormonal. | |
2 | TraesCS2A02G107000 | A0A341PZ27 | RSTK | Respuesta a estrés biótico y abiótico. |
TraesCS2A02G106700 | A0A1D5TN11 | POD | Mecanismos de defensa. | |
TraesCS2A02G106800 | A0A341PUV9 | TPK | Resistencia a estrés biótico y abiótico. | |
3 | TraesCS2A02G525500 | W5ASP5 | LOX | Crecimiento y desarrollo, estrés, senescencia, etc. |
4 | TraesCS2B02G176000 | A0A1D5UCP9 | DIR | Respuesta a sequía, salinidad y estrés oxidativo. |
TraesCS2B02G175800 | A0A1D5UFD5 | RSTK | Respuesta a estrés biótico y abiótico. | |
TraesCS2B02G176200 | A0A080YU40 | UGT | Desarrollo y crecimiento, resistencia a enfermedades. | |
TraesCS2B02G177100 | A0A341PYM4 | NA | Respuesta al frío, déficit de agua, estrés salino, etc. | |
5 | TraesCS2B02G193500 | W5BPC0 | RING-E3 | Respuesta a estrés abiótico. |
TraesCS2B02G193600 | W5BPN4 | ALT1,2 | Respuesta hipoxia y anoxia. | |
TraesCS2B02G193700 | A0A1D5U885 | F-box | Respuesta de defensa hormonal y estrés abiótico. | |
6 | TraesCS2B02G553600 | A0A1D5TZL6 | SEP2 | Respuesta al estrés lumínico (K-box y MADS-box). |
TraesCS2B02G554500 | G3FIP0 | DREB2 | Respuesta a la deshidratación. | |
TraesCS2B02G554600 | A0A341QXE7 | Hidrotropismo | Reacción al estímulo de agua o humedad. | |
TraesCS2B02G554700 | A0A341R834 | RLK | Respuesta de defensa. | |
7 | TraesCS2D02G073600 | A0A341R4Y5 | GLP | Respuestas al estrés abiótico, exposición al calor, la sal y el aluminio. |
8 | TraesCS2D02G435200 | A0A1D5UNL9 | GRF4-D1 | Regulación del crecimiento. |
TraesCS2D02G435300 | A0A2X0SA68 | D1-DWARF1 | Respuesta celular al frío y ácido abscísico | |
9 | TraesCS2D02G528400 | A0A1D5UR29 | LOX | Crecimiento y desarrollo, estrés, senescencia, etc. |
TraesCS2D02G534400 | A0A1D5UH93 | RSTK | Respuesta a estrés biótico y abiótico. | |
TraesCS2D02G534600 | A0A341RJ78 | DGK | Respuesta al estrés por congelación. | |
10 | TraesCS3B02G137800 | A0A341SBA6 | Tudor | Tolerancia al estrés salino. |
TraesCS3B02G138400 | A0A1D5VQ05 | Homeobox | Procesos de desarrollo y respuesta hormonal. | |
11 | TraesCS3B02G562700 | A0A077S8R7 | β-1,3-glucanos | División celular, resistencia a estrés abiótico. |
12 | TraesCS4A02G330400 | A0A341TN72 | EF-Tu | Aclimatación al calor. |
TraesCS4A02G331000 | W5DR31 | F-box | Respuesta de defensa hormonal y estrés abiótico. | |
13 | TraesCS4A02G381100 | A0A341TWL3 | RSTK | Respuesta a estrés biótico y abiótico. |
TraesCS4A02G382200 | W5DQV3 | Homeobox | Procesos de desarrollo y respuesta hormonal. | |
TraesCS4A02G382600 | A0A341TWM7 | F-box | Tolerancia a estrés biótico y abiótico. | |
TraesCS4A02G382700 | A0A341TUP2 | E3-U | Respuesta a estrés abiótico. | |
14 | TraesCS4B02G361500 | A0A1D5XNM3 | NA | Respuesta de defensa. |
TraesCS4B02G364500 | A0A1D5XKM0 | UGT | Desarrollo y crecimiento, resistencia a enfermedades. | |
TraesCS4B02G363400 | A0A1D5XHF3 | NA | Ciclo celular (Meiosis), microsporogenesis, etc. | |
15 | TraesCS5A02G247000 | A0A1D5YFJ0 | RSTK | Ciclo celular (Mitosis), división celular. |
16 | TraesCS5A02G383800 | A0A1D5YRN0 | HSF | Respuesta celular al calor. |
TraesCS5A02G384500 | A0A1D5YDW0 | ARN Helicasa | Respuesta estrés salino, déficit de agua, etc. | |
17 | TraesCS5A02G391700 | Q5ETV1 | MADS-box WM6 | Vernalización (Vrn-A1) |
18 | TraesCS6B02G370800 | A0A1D6ANZ6 | U-box | Respuesta estrés abiótico. |
TraesCS6B02G368300 | A0A1D6ATD5 | XTH | Biogénesis de la pared celular. | |
19 | TraesCS7B02G375600 | A0A1D6C5B8 | POD | Respuesta estrés oxidativo. |
TraesCS7B02G376400 | A0A1D6C2E6 | Kinase | Respuesta a estrés biótico y abiótico. | |
20 | TraesCS7D02G500300 | A0A341Z6N1 | RSTK | Respuesta a estrés biótico y abiótico. |
Crom = Cromosoma; BA = Bloque de asociación; XTH = Xiloglucano endoTransglucosilasa-Hidrolasa; TTHV = Tionina tipo 5; CytB561 = CitocromoB561; ARF = Factores de respuesta a auxinas; RSTK = Quinasas de serina/treonina; POD = Peroxidasas; TPK = Tiamina pirofosfoquinasa; LOX = Lipogenasas; DIR = Proteína dirigente; RSTK = Quinasa de ciclina N; UGT = UDP-glicosiltransferasa; RING-E3 = Ligasas RING tipo E3; ALT1,2 = Alanina aminotransferasa 1 y 2; SEP2 = ortólogo del gen SEPALLATA 2 de A. thaliana; DREB2 = Proteína de unión a elementos sensibles a la deshidratación; RLK = Receptor de serina/treonina; GLP = Germina; GRF4-D1 = Factor de regulación de crecimiento D1; DGK = Diacilglicerol quinasa ; β-1,3-glucanos = Glucano endo-1,3-β-D-glucosidasa; EF-Tu = Factores de elongación Tu; E3-U = Ligasas de ubiquitina E3; HSF = Factor de transcripción de choque térmico; ARN Helicasa = ortólogo del gen de EDA15 de A. thaliana.
Discusión
Algunas de las asociaciones entre marcadores SNP’s y el hábito de crecimiento detectadas por el GWAS implican polimorfismos dentro de genes de vernalización documentados en T. aestivum, como es el caso del gen Vrn1, cuyas copias homologas se localizan en los cromosomas 5A, 5B y 5D (Li et al. 2020). Este gen posee particular importancia en la diferenciación del hábito de crecimiento, ya que la presencia de variaciones alélicas dominantes causadas por mutaciones en regiones reguladoras confieren el hábito primaveral (Konopatskaia et al. 2016). En este sentido, existe congruencia en los resultados obtenidos, ya que se observó un conjunto de marcadores SNP’s formando un marcado BA con el gen Vrn1 en el cromosoma 5A.
Los BA revelaron la presencia de proteínas con diversidad de dominios (Tabla 2) entre las que destacan las relacionadas con cambios estructurales y metabólicos de respuesta al estrés de las plantas. En este sentido Kosová et al. (2011) argumentan que los cambios en la acumulación de las proteínas durante un periodo de estrés están estrechamente relacionados con el proceso de aclimatación. Estos resultados son similares a los encontrados por Kosová et al. (2013) quienes observaron la expresión de proteínas de regulación de respuesta al estrés y del desarrollo, además de proteínas de defensa y proteínas involucradas en la restauración de la división celular durante el proceso de aclimatación al frío en trigos de primavera e invierno. Otro estudio realizado por Wójcik-Jagta et al. (2021) también mostró la expresión de proteínas de respuesta al estrés, además de proteínas de choque térmico relacionadas con la tolerancia a la congelación y proteínas implicadas en funciones estructurales al estudiar la respuesta a la desaclimatación en cebada. Particularmente, notaron una sobreexpresión de enzimas Peroxidasas en variedades susceptibles, lo que muestra la importancia de dichas proteínas en los mecanismos de respuesta a la desaclimatación al frío.
En este sentido, las proteínas quinasas en sus distintas formas han sido reportadas como elementos clave en la traducción de señales que responden a diversos tipos de estrés en las plantas (Calliste et al. 2008, Sinha et al. 2011). Un ejemplo de ello, son las quinasas RLK implicadas en la señalización durante el reconocimiento de patógenos y la posterior activación de los mecanismos de defensa (Afzal et al. 2008). Otras quinasas denominadas RSTK intervienen en la regulación del desarrollo y las vías de señalización de autoincompatibilidad, así como en procesos de resistencia a enfermedades (Goring y Walker 2004).
En trigo, el gen WPK4 que codifica una proteína RSTK es reconocido por desempeñar funciones de control en el metabolismo del nitrógeno y la asimilación del carbono durante períodos de baja temperatura (Ikeda et al. 1999). Por otro lado, el estudio de genes homólogos de WPK4 en maíz y arroz sugieren la expresión diferencial del gen en las distintas especies en respuesta a estímulos ambientales, sobre todo en la exposición a bajas temperaturas (Ohba et al. 2000). De igual manera, las proteínas de caja F desempeñan funciones importantes en las respuestas a tensiones bióticas a través de la vía de la ubiquitina (Yee y Goring 2009, Zhou et al. 2015). También se ha notado su expresión en procesos cruciales en las plantas, como la embriogénesis, las respuestas hormonales, el desarrollo de las plántulas, la organogénesis floral y la senescencia (Xu et al. 2009). En trigo, algunos genes de caja se asocian con la tolerancia a estrés de tipo oxidativo, hídrico y salino (Zhou et al. 2014, Wang et al. 2020). Por su parte, los genes homeobox son señalados por intervenir en el desarrollo reproductivo y en la señalización durante estrés abiótico (Tan e Irish 2006, Jain et al. 2008). Mientras tanto, a las enzimas Glicosiltransferasas (UGT) se les atribuye procesos de regulación hormonal y de biosíntesis de compuestos secundarios implicados en el crecimiento, desarrollo y resistencia a enfermedades en algodón (He et al. 2018).
Algunos marcadores significativos situados en los brazos largos de los cromosomas 2A, 2B y 2D evidencian regiones genómicas coincidentes. Particularmente en los cromosomas 2B y 2D donde se pueden observar BA conformados por varios marcadores. Dichas regiones evidencian la presencia de proteínas Lipogenasas (LOX), las cuales desempeñan un papel fundamental en procesos fisiológicos de las plantas, como la germinación, crecimiento, de sarrollo y respuestas al estrés por calor y salinidad (Shaban et al. 2018, Viswanath et al. 2020). Por otro lado, el BA situado en el cromosoma 2B expresó algunos genes documentados en bases de datos, el primero es un ortólogo del gen SEP2 reportado en Arabidopsis thaliana, el cual es un gen perteneciente a la familia de reguladores transcripcionales de caja MADS de tipo II involucrado en la diferenciación y regulación floral (Moore et al. 2005). El otro gen es DREB2, cuya expresión es inducida por el frío y la deshidratación (Akbudak et al. 2018).
Dado que la mayoría de las proteínas expresadas en los genes pertenecientes a los BA formados por los marcadores significativos apuntan a la expresión de factores de respuesta a diversos tipos de estrés, los cuales dependen en gran medida de factores exógenos y endógenos como la temperatura del ambiente, la disponibilidad de agua, el fotoperíodo, entre otros, se puede denotar su inferencia en la determinación del hábito de crecimiento, que como bien se menciona ha sido atribuida principalmente a mutaciones genéticas del gen de vernalización Vrn1. Lo anterior, reafirma las teorías de algunos autores (Saisho et al. 2011, Chen y Dubcovsky 2012, Shcherban y Salina 2017) sobre la posible acción de genes desconocidos en la expresión de Vrn1 y en el complejo genético regulador de la floración.
Conclusiones
Se proporciona información adicional para comprender las funciones potenciales de nuevos genes en la determinación del hábito de crecimiento en Triticum aestivum. Los resultados identifican 20 regiones genómicas ubicadas en 11 cromosomas con posibles genes candidatos, cuyo estudio y caracterización puede ser base en la predicción genómica del hábito de crecimiento en colectas no clasificadas. La presencia de un abundante bloque de asociación cercano al gen de vernalización Vrn1, que es sumamente importante en la determinación del hábito de crecimiento, es un indicador de la confiabilidad de los métodos utilizados en este estudio.