Introducción
La naturaleza fitopatógena de los hongos depende en gran medida de su capacidad y modo de interactuar con el organismo huésped. En este sentido, existe una clasificación que delimita tres grupos representativos distintos, que son: fitopatógenos biotróficos, necrotróficos y hemibiotróficos (Meinhardt et al., 2014). Moniliophthora roreri se considera un hongo basidiomiceto fitopatógeno perteneciente a la familia Marasmiaceae del orden Agaricales (Aime y Phillips-Mora, 2005). El organismo se caracteriza por atacar únicamente frutos de diversas especies de los géneros botánicos Herrania y Theobroma, por lo que se considera el agente causal de la moniliasis en este último (Figura 1) (Evans, 1981). La infestación en plantas de cacao resulta evidente cuando la especie fitopatógena causa daños necróticos en el tejido interno del fruto, lo que culmina en la mayoría de los casos en la pérdida de éste (Phillips-Mora et al., 2007; Hipólito Romero et al., 2017).
A nivel molecular, existen pocos antecedentes sobre la naturaleza genómica de M. roreri. Por mencionar algunos ejemplos importantes; Costa et al. (2012) reportaron la secuencia del genoma mitocondrial (mt) de esta especie, cuyos resultados se compararon parcialmente con su pariente más cercano Moniliophthora perniciosa. Entre muchas características interesantes, el ADNmt de M. roreri (94 Kb) posee una topología circular que hipotéticamente codifica 14 genes relacionados con procesos de fosforilación oxidativa. Además de ello, éste transcribe genes tipo ARNr (ARN ribosomal), subunidades proteicas ribosomales, 13 marcos de lectura abierta intrónica (ORFs; Open Reading Frames) y un complemento de 27 genes tipo ARNt (ARN de transferencia). Estudios posteriores permitieron secuenciar y ensamblar 52,3 Mpb representados por 3,298 cóntigos (secuencias consenso de ADN) correspondientes al genoma de una cepa de M. roreri proveniente del estado de Los Ríos, Ecuador (Meinhardt et al., 2014). Por su parte, Barbosa et al. (2018) realizaron la secuenciación y caracterización molecular de los genomas de seis cepas del género Moniliophthora divididas en subpoblaciones empleando plataformas de nueva generación.
Es importante mencionar que parte del genoma de M. roreri codifica proteínas relacionadas con fenómenos de retrotransposición, especies reactivas de oxígeno (ROS; Reactive Oxygen Species) y degradación de pared celular. Por otra parte, el considerable número de genes que codifica monooxigenasas citocromo P450, sugiere que el género Moniliophthora posee un gran potencial de detoxificación, al igual que síntesis de toxinas y distintos tipos de compuestos indólicos, lo que conferiría una alta capacidad de adaptación ambiental a sus especies fúngicas. El género en mención también es capaz de secretar polipéptidos ricos en cisteína, así como expresar genes involucrados en metilotrofía y biosíntesis de hormonas de crecimiento vegetal (e.g. giberelinas y auxinas). Los pocos análisis profundos de la familia de genes de Moniliophthora sugieren que transcribe cantidades considerables de carboxilesterasas (Mondego et al., 2008).
A la luz de las consideraciones anteriores, este trabajo tuvo como objetivo principal; caracterizar parte del genoma de una cepa de M. roreri, previamente aislada de cacao en el Estado de Tabasco, México. Para lo anterior, se diseñó un conjunto de metodologías que permitieron la construcción de biobancos y su respectiva secuenciación a través de plataformas de nueva generación, incluyendo distintos análisis computacionales que, en conjunto, dieron un vistazo a un fragmento de la naturaleza genómica de la cepa fúngica. De esta forma se develaron parcialmente algunos de sus mecanismos de evolución adaptativa así como de competencia interespecífica, pero principalmente mediante reconstrucciones filogenéticas; la presencia de supuestos genes que estarían relacionados con adaptación al estrés, metabolismo secundario y capacidad necrótica vegetal, cuyos procesos metabólicos son considerados imperativos durante el ciclo de infestación de los hongos hemibiotróficos.
Materiales Y Métodos
Obtención e identificación de M. roreri CPMRT01
La cepa de M. roreri utilizada en este estudio fue donada por el Laboratorio de Fitopatología del Colegio de Postgraduados, campus Tabasco, y su aislamiento se llevó a cabo de la manera siguiente: el hongo fue obtenido de frutos de cacao en estado inicial de necrosis externa, procedentes del Estado de Tabasco, México. Una vez en el laboratorio, las drupas se sometieron a un proceso de desinfección externa con hipoclorito de sodio al 2.5 % durante 1 min, seguido de tres lavados con agua destilada estéril. Después de remover la dermis, con la ayuda de un bisturí se transfirieron pequeñas fracciones de tejido interno a cajas de Petri que contenían agar papa dextrosa (Evans, 1981). De esta manera se obtuvieron colonias maduras en un periodo de ≈10 días y se subcultivaron en placas de agar V8 clarificado, a 25 ± 2 °C. Las colonias fueron identificadas morfológicamente con la ayuda de claves taxonómicas (Phillips-Mora et al., 2006; Evans 1981).
Posteriormente, se produjo biomasa (pellets) mediante fermentación líquida en caldo papa dextrosa incubado durante 10 días a 150 rpm y una temperatura de 25 ± 2 °C. Previamente, se llevó a cabo la caracterización molecular de esta cepa a través de la secuenciación de un transcrito de 853 pb mediante PCR (Reacción en Cadena de la Polimerasa), utilizando ADN genómico como plantilla e iniciadores para regiones ITS (Espaciadores Internos Transcritos) (Torres-de la Cruz et al., 2016) (GenBank: GU108605), cuyos resultados de análisis de máxima identidad mostraron el 100 % respecto a distintas accesiones de M. roreri previamente depositadas en el repositorio del NCBI (Centro Nacional para la Información Biotecnológica (https://www.ncbi.nlm.nih.gov).
Extracción de ADN nuclear
Bajo condiciones asépticas, se separó el micelio del medio de cultivo respectivo con la ayuda de asa bacteriológica, eliminando el exceso de agar y congelando el material biológico mediante vertido de nitrógeno líquido. Se pulverizó por maceración en frío con la ayuda de un mortero.
Posteriormente, se partió de 200 mg de tejido en polvo y se adicionaron 900 µL de buffer de Lin (Lin et al., 2001), 12 µL de β-mercaptoetanol y 2 µL de RNAsa (20 mg/mL). Se mezcló perfectamente y se incubó a 37 °C durante 1 h y 600 rpm o agitación suave. Se incorporó un volumen de mezcla de fenol-cloroformo-alcohol isoamílico (25:24:1) y se centrifugó a 12,000 rpm por 10 min a 4 °C, repitiendo este paso dos veces más. Se recuperó el sobrenadante adicionando un volumen de isopropanol frío al 100 % y se incubó a -20 °C durante 1 h. Después, se realizó una centrifugación a 12,000 rpm por 10 min a 4 °C y se decantó el sobrenadante. A la pastilla o cúmulo restante se le adicionaron 500 µL de etanol absoluto al 70 % y se centrifugó a 12,000 rpm por 30 s. Cuidadosamente se eliminó el etanol dejando secar el remanente a temperatura ambiente. Por último, se realizó una hidratación de la pastilla adicionando 30 µL de agua libre de nucleasas (AMBION), se cuantificó por espectrofotometría A260/A280 y se corroboró su integridad mediante electroforesis en gel de agarosa. El material genético se almacenó a -70 ºC hasta su uso.
Generación de bibliotecas genómicas y secuenciación por síntesis
Con el material genético de M. roreri extraído previamente, se generaron dos bibliotecas tipo TruSeq® con un promedio de 17,5 ng/µL (insertos cortos) y 18,2 ng/µL (insertos largos tipo mate -pairs). Los pasos seguidos fueron los siguientes: (1) fragmentación de ADN con enzimas de restricción (BgI II y Dde I) y generación de insertos de ≈550 pb y ≈7Kbp (fragmentos de ADN de doble cadena con extremos 3´ y 5´); (2) reparación de extremos y selección del tamaño de la biblioteca y fragmentación de extremos romos; (3) adenilación de extremos 3´ y adición de nucleótidos adenina a los extremos romos 3´; (4) ligación de adaptadores a múltiples extremos de los fragmentos de ADN; (5) enriquecimiento de fragmentos de ADN mediante anillamiento a los extremos de los adaptadores mediante PCR; (6) validación de bibliotecas mediante cuantificación fluorométrica por qPCR (PCR cuantitativa) y verificación de la distribución del tamaño de los fragmentos; (7) normalización y reacomodo en placas de secuenciación diluida (normalización de las bibliotecas genómicas a 10 nM). Finalmente, el proceso de secuenciación se realizó en una plataforma NextSeq 500 (Illumina) con 2 lecturas pareadas. Los archivos de lectura de secuencias cortas (SRA) se depositaron en el repositorio Entrez del NCBI, bajo el número de acceso: PRJNA515757.
Procesamiento de lecturas crudas de secuenciación
Se desarrolló una estrategia técnica para procesar las lecturas de secuenciación provenientes de los insertos genómicos, la cual constó de cinco pasos: (1) análisis de calidad de 65,685,731 lecturas mediante el software MultiQC (Ewels et al., 2016), tomando en cuenta tanto las secuencias ≈26-140 pb como el % de GC; (2) corte de secuencias filtrando adaptadores de secuenciación y, tomando como nivel de calidad Phred ≤30; 1 error en 1,000 bases secuenciadas (Q = log10 P); (3) simulación de ensamblaje continuo de secuencias utilizando el software ALLPATHS-LG: se programó el algoritmo para que empleara cóntigos de 6,000 pb como máximo y posteriormente se ejecutó el corrector de errores ALLPHATS-LG error corrector (parámetros de corrección estándar con eliminación de espacios vacíos o brechas y secuencias repetidas). Con el fragmento del genoma previamente terminado, los cóntigos filtrados se calcularon en función del tamaño conocido del genoma de referencia (MacCallum et al., 2009). La corroboración del proceso de corrección de secuencias y revisión de estadísticas de alineación se realizó con el programa dnadiff ver 2.0 (Phillippy et al., 2008). Finalmente se partió de lecturas limpias con valores óptimos; (4) filtrado de lecturas cortas inferiores a 200 nt. Para excluir datos provenientes de posibles contaminantes (i.e. material genético de otros organismos) se utilizó la herramienta BlobPlot (https://blobtools.readme. io) (Laetsch y Blaxter, 2017) generando líneas de comando de partición del genoma de M. roreri a partir del contenido de guanina y citosina, cobertura de secuenciación en las bibliotecas y máxima identidad de secuencias consenso.
Estimación de máxima identidad de lecturas procesadas de secuenciación
Basado en los resultados obtenidos de la fase de “control de calidad” de los insertos de ADN secuenciados, se procedió a filtrar las secuencias consenso con un valor Q≤30 seguido de la distribución de lecturas (calidad vs longitud de lectura), lo que permitió comparar parte del genoma del organismo sujeto a estudio con un fragmento del genoma (shotgun sequence) de M. roreri MCA 2952 (LATX01000001.1) que se encuentra disponible en el repositorio del NCBI (datos sin publicar) y es proveniente del Estado de Chiapas, México. El proceso anterior se realizó con el software ACT; Artemis Comparison Tool (Carver et al., 2005).
Reconstrucción filogenética de regiones consenso de ADN
Para realizar el estudio de reconstrucción filogenética se emplearon 35 cóntigos que mostraron máxima similitud respecto a proteínas transcritas de los géneros Moniliophthora y Theobroma previamente depositadas en el repositorio del NCBI y, cuya predicción funcional se correlacionaría con diversos procesos metabólicos de etapas hemi y biotróficas por parte del hongo. Se utilizó en primera instancia el método de unión de secuencias vecinas (Neighbor-Joining; NJ) (Saitou y Nei, 1987) complementado por predicciones de probabilidad máxima compuesta (Tamura et al., 2004) que eliminaron todas las posiciones que contenían brechas (gaps) y datos vacíos, generando un árbol radial con parámetros de remuestreo (bootstrapping) de 500 réplicas. Por otra parte, a través de una búsqueda heurística y aplicando algoritmos de unión-vecindad y BioNJ a una matriz de distancias estimadas en pares, se realizaron análisis estadísticos de máxima verosimilitud (MLE) bajo el modelo Tamura-Nei (Tamura y Nei, 1993).
Se recurrió también al método de máxima probabilidad de composición (MCL) para seleccionar topologías con un valor de probabilidad de registro superior. Asimismo se generó un agrupamiento jerárquico aglomerado simple con media aritmética (UPGMA; Unweighted Pair Group Method with Arithmetic Mean) (Sneath y Sokal, 1973). Las distancias evolutivas se calcularon utilizando el método de probabilidad máxima compuesta (Tamura et al., 2004) y se representaron como el número de sustituciones de bases nucleotídicas por sitio. Todos los análisis evolutivos anteriores se realizaron con MEGA7 versión 7.0 (Kumar et al., 2016).
Caracterización de dominios conservados y predicción funcional de regiones consenso de ADN
La búsqueda de hipotéticos dominios conservados de las secuencias consenso de ADN se llevó a cabo con el algoritmo CDD/SPARCLE a nivel de subfamilia y se programó para que éste realizara predicciones aleatorias de marcos de lectura abierta (predicted sequences) (Marchler-Bauer et al., 2017) (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb. cgi). Las secuencias de aminoácidos de los 35 cóntigos transcritos se obtuvieron mediante el software EXPASy Translate Tool (https://web.expasy.org/translate/) y se identificaron marcos de lectura abierta en orientación 5´-3´ así como sitios activos y de enlace, al igual que triadas y residuos catalíticos. De manera complementaria se realizó una alineación múltiple de secuencias de algunos cóntigos basada en restricciones por pares. La predicción heurística funcional se generó mediante comparaciones genómicas de máxima identidad utilizando BLAST (https://blast.ncbi.nlm.nih.gov) y tomando como referencia una base de datos con 20,128 secuencias de proteínas reportadas en NCBI para M. roreri. Se emplearon de manera complementaria los algoritmos MAKER-GMOD (http://www.yandell-lab.org/software/maker.html) así como BUSCO v3 (https://busco.exlab.org) (Waterhouse et al., 2017) para analizar las secuencias respecto a su predicción funcional y evolución molecular a partir de copias únicas de genes ortólogos.
Resultados
Máxima identidad genómica de M. roreri CPMRT01
Mediante el análisis correspondiente, se logró correlacionar el material genético de M. roreri CPMRT01 con un 93,11 % de identidad genómica respecto a la cepa de referencia. Aunado a lo anterior, se realizó un análisis BLAST para identificar al resto de los organismos que coincidieron con la muestra y que fueron descartados para este estudio, por lo que se filtraron las secuencias correspondientes a M. roreri para seleccionar al resto de posibles organismos homólogos durante el análisis (e.g. Theobroma cacao). En la Tabla 1 se observa la descripción de cóntigos identificados por su máxima similitud y características contenidas por columna.
Cóntigo | Número accesión NCBI | % lectura alineada | Longitud Nucleótido alineados | Posición Inicial lectura | Posición final lectura | Organismo/predicción |
---|---|---|---|---|---|---|
397 | gi|397648737|gb|JX024739.1| | 87,8 | 3,516 | 7,421 | 10,910 | M. perniciosa methanol oxidase gene |
1295 | gi|374683156|gb|JN620344.1| | 84,34 | 645 | 4,263 | 4,888 | M. perniciosa CP02 PR-1 protein (PR-1e) gene |
1434 | gi|599126472|gb|KJ526207.1| | 89,68 | 862 | 2,144 | 3,005 | M. perniciosa MpSaci26 retrotransposon hypothetical Protein |
1609 | gi|599126451|gb|KJ526187.1| | 80,54 | 6, 012 | 1 | 5,955 | M. perniciosa MpSaci6 retrotransposon unautonomous hypothetical protein |
1456 | gi|159786346|gb|EU218539.1| | 85,22 | 846 | 1,073 | 1,917 | M. perniciosa transposon Boto hypothetical protein |
2204 | gi|1042907538|emb|LT594789.1| | 100 | 28 | 1,229 | 1256 | T. cacao genome assembly, chromosome: II |
4810 | gi|1042907684|emb|LT594796.1| | 96,86 | 542 | 1 | 542 | T. cacao genome assembly, chromosome: IX |
5881 | gi|1184802641|gb|KY085907.1| | 100 | 380 | 1 | 380 | T. cacao plastid, complete genome |
8419 | gi|337730156|gb|JN127762.1| | 99,56 | 228 | 1 | 228 | T. cacao clone TCC_BA003D04, complete sequence hypothetical protein |
8658 | gi|337730159|gb|JN127765.1| | 79,06 | 191 | 27 | 215 | T. cacao clone TCC_BA049P20, complete sequence hypothetical protein |
2790 | gi|5991266476|gb|kj526211.1| | 88,24 | 68 | 27 | 94 | M. perniciosa Mpsaci30 retrotransposon |
2899 | gi|599126468|gb|kj526203.1| | 86,67 | 75 | 1,469 | 1543 | M. perniciosa CP01 gene (defense protein) |
4960 | gi|599126463|gb|kj526198.1| | 95,12 | 41 | 268 | 308 | M. perniciosa MPsaci29 retrotransposon hypothetical protein |
5524 | gi|599126475|gb|kj5262210.1| | 100 | 28 | 216 | 243 | M. perniciosa MPsaci30 retrotransposon non-autonomous |
2262 | gi|599126466|gb|kj526201.1| | 74,14 | 321 | 1,578 | 1894 | M. perniciosa genome assembly, partial cds |
2159 | gi|599126448|gb|kj526184.1| | 96,97 | 33 | 2,391 | 2,423 | M. perniciosa MPsaci13 retrotransposon |
8621 | gi|397648737|gb|JX024739.1| | 97,8 | 1,490 | 6,425 | 7,921 | M. perniciosa MO hypothetical protein |
2708 | gi|599126472|gb|KJ526207.1| | 89,56 | 930 | 5,144 | 6,078 | M. perniciosa MpSaci27 retrotransposon hypothetical protein |
6997 | gi|374683156|gb|JN620344.1| | 88,57 | 2,560 | 4,321 | 6,887 | M. perniciosa protein (PR-1e) gene |
8028 | gi|599126463|gb|kj526198.1| | 91,23 | 230 | 560 | 790 | M. perniciosa MPsaci25 retrotransposon hypothetical protein |
8120 | gi|134118907|ref|XM_766864.1| | 98,56 | 342 | 115 | 457 | M. perniciosa Mpsaci33 retrotransposon hypothetical protein |
1707 | gi|159786346|gb|EU218539.1| | 89,21 | 1,220 | 1,067 | 2,300 | M. perniciosa Boto hypothetical protein |
2186 | gi|599126453|gb|kj526189.1| | 95,43 | 553 | 89 | 642 | M. roreri hypothetical protein |
1691 | gi|397648737|gb|JX024739.1| | 89,89 | 1,427 | 5,491 | 6,918 | M. perniciosa methanol oxidase hypothetical protein |
2879 | gi|599126466|gb|kj526201.1| | 86.4 | 1,314 | 2,576 | 3,895 | M. perniciosa genome assembly, partial cds |
7047 | gi|599126473|gb|kj5226208.1| | 97.53 | 283 | 1 | 283 | M. perniciosa hypothetical protein |
4478 | gi|599126453|gb|kj526189.1| | 100 | 28 | 573 | 600 | M. roreri hypothetical protein |
4961 | gi|134118907|ref|XM_766864.1| | 97,37 | 38 | 88 | 125 | M. perniciosa Mpsaci30 retrotransposon hypothetical protein |
6079 | gi|599126464|gb|kj526203.1| | 82,73 | 110 | 195 | 303 | M. perniciosa Mpsaci36 retrotransposon hypothetical protein |
6996 | gi|1063457698|ref| XM_018129897.1 | 94,78 | 115 | 3 | 117 | 1PREDICTED: Theobroma cacao vasodilator-stimulated phosphoprotein-like (LOC108663971), partial mRNA |
8353 | gi|1063465904|ref| XM_018114244.1| | 99,57 | 230 | 1 | 230 | 1 PREDICTED: Theobroma cacao subtilisin- like protease SBT1.1 (LOC18614246), mRNA |
8850 | gi|1063461799|ref| XM_007050642.2| | 100 | 213 | 1 | 213 | 1PREDICTED: Theobroma cacao transcription termination factor MTERF4, chloroplastic (LOC18613422), mRNA |
8564 | gi|1063509784|ref| XM_018123082.1| | 100 | 91 | 77 | 167 | 1PREDICTED: Theobroma cacao subtilisin-like protease SBT1.1 (LOC18614246), mRNA |
8930 | gi|1063502088|ref| XM_018120943.1| | 92,45 | 106 | 4 | 109 | 1PREDICTED: Theobroma cacao uncharacterized LOC108661946 (LOC108661946), mRNA |
5296 | gi|1063509680|ref| XR_001928432.1| | 91,04 | 134 | 158 | 290 | 1PREDICTED: Theobroma cacao uncharacterized LOC108662550 (LOC108662550), ncRNA |
Nota: Número de accesión NCBI; código del repositorio para futuras consultas, % lectura alineada; se tomó como referencia secuencias del repositorio NCBI.
1PREDICTED: referencia de cóntigos anotados funcionalmente que no se encuentran reportados en el NCBI (cóntigos predichos).
Reconstrucción filogenética
Mediante reconstrucciones filogenéticas se generó un árbol radial óptimo empleando el método NJ (Figura 2) que involucró la alineación de secuencias nucleotídicas de 35 cóntigos que mostraron máxima identidad en los análisis correspondientes. La suma total de longitud de las ramas fue de 28.6254 sustituciones por sitio, incluyendo las distancias evolutivas para cada una de éstas y tomando en cuenta su probabilidad máxima compuesta. Al eliminar todas las posiciones que contenían espacios faltantes, se generó un conjunto final de datos de 219 nucleótidos distintos. La Figura 2 muestra una reconstrucción que sugiere la presencia de seis grupos principales, que a su vez albergan subgrupos adyacentes conformados por accesiones genéticas previamente anotadas y predichas. La mayoría de las predicciones respectivas para Moniliophthora y Theobroma sugieren conjunción en subgrupos, inclusive para el caso de las secuencias hipotéticas.
Las Figuras 3 (MLE) y 4 (UPGMA) muestran los resultados de los análisis evolutivos moleculares complementarios, respectivamente. La suma total de la longitud de las ramas fueron las siguientes: MLE= -19,207,954.26 y UPGMA= 0.00925867 sustituciones por sitio (probabilidad de registro más alta). Se calculó la divergencia evolutiva con estimadores mínimos para cada caso y en virtud de ello, se observó una reagrupación distinta de las muestras. La filogenia evolutiva obtenida con los métodos de unión de secuencias vecinas (Figura 2) y agrupamiento jerárquico aglomerado (Figura 4) sugiere que los grupos se organizan por pares o subramas primarias dependiendo de los valores obtenidos de los parámetros de remuestreo replicado. No obstante, mediante el análisis de máxima verosimilitud (Figura 3), se observó un aglomerado en pares de cuatro secuencias consenso (i.e. cóntigos 4478 y 2879; 4961 y 8564) que representa la rama primaria de la filogenia (out group) que da origen a los clados restantes.
Caracterización de dominios conservados
Respecto a la caracterización de dominios conservados, se observaron similitudes secuenciales en al menos cuatro cóntigos distintos (i.e. 1295, 1609, 1961, 8353) (Figura 5). Los análisis predictivos sugieren la presencia de posibles marcos de lectura abierta pertenecientes a superfamilias de proteínas ricas en cisteína (SCP), peptidasas tipo S8 y transposasas tipo Tnp4, entre otras. También se detectaron dominios de proteínas relacionadas con procesos de fitopatogenicidad, sitios de hibridación y enlace, y ORFs relacionados con el metabolismo secundario de Moniliophthora, incluyendo procesos de transcripción y retrotransposición. De manera complementaria, se observaron distintos sitios activos y catalíticos en un rango de 250 a 1000 pb mediante la alineación de 11 secuencias de cóntigos relacionados con M. perniciosa y proteínas hipotéticas de T. cacao (considerándolo como organismo homólogo). Las principales alineaciones de nucleótidos se predicen entre las 610 y 710 pb a lo largo de los cóntigos (Figura 5).
Predicción funcional de regiones consenso
La predicción funcional de regiones consenso se realizó preparando una base de datos que constó de 20,128 péptidos reportados para M. roreri. El algoritmo Maker-GMOD permitió identificar regiones homólogas respecto a secuencias proteicas descargadas del repositorio correspondiente, así como regiones con repeticiones y predicciones de novo sin referencia reportada en el NNCBI (Tabla 1). El análisis mostró 424, 276 predicciones; equivalentes a 9,142 cóntigos analizados de los cuales 5,420 presentaron ciertas evidencias respecto a su predicción heurística y, al menos 35 de ellos sugieren máxima identidad en relación con proteínas tipo PR-1 metanol oxidasas, retrotransposones, fosfoproteínas, proteasas y genes CP01, entre otros (Tabla 1).
Discusión
En el caso del reino de los hongos, es posible estudiar mediante técnicas moleculares la naturaleza de interacciones fitopatógeno-hospedador, las bases bioquímicas de conidiación, así como rutas metabólicas que conducen a la reproducción sexual, entre otros conceptos fisiológicos. En relación con aspectos filogenéticos de T. cacao, el genoma del clon Matina 1-6 se ha anotada en un 99 % respecto a su variabilidad secuencial, observándose un tamaño aproximado de 445 Mpb, lo que resulta considerablemente más grande que el genoma de la variedad criolla (430 Mpb) (Motamayor et al., 2013). Estos antecedentes permitieron identificar y caracterizar distintos genes de interés biotecnológico y agrícola (Ricaño-Rodríguez et al., 2018) incluyendo al campo de la fitopatología, pues el correcto entendimiento de la organización genómica del cacao develaría el origen de respuestas epigenéticas desencadenadas por la interacción con su principal antagonista, Moniliophthora roreri. Lo anterior se fundamenta en el comportamiento biotrófico de los géneros Theobroma y Moniliophthora, y en virtud de ello, se abre la posibilidad de que el fenómeno sea estudiado inclusive a nivel transcriptómico (Jones y Dangl, 2006).
Respecto al género Moniliophthora, tales antecedentes se complementan con el estudio de su mecanismo de fitopatogenicidad para con el cacao a nivel molecular (Teixeira et al., 2014). Es importante mencionar que Barbosa et al. (2018) realizaron la secuenciación genómica de seis subpoblaciones de M. perniciosa y M. roreri. Los genomas de estas cepas oscilaron entre las 44 y 47 Mpb, lo que representa en promedio el 87.5 % del genoma reportado por Meinhardt et al. (2014) y un 13.5 % del genoma de M. roreri CPMRT01. A la luz de las consideraciones anteriores y de acuerdo con los resultados de esta investigación referentes a la reconstrucción filogenética de secuencias consenso de ADN la cepa CPMRT01, se concluye que los índices de máxima identidad encontrados corresponden a los géneros Moniliophthora y Theobroma, pues las predicciones muestran porcentajes >85 % en relación con accesiones de genes tipo PR-1e (estrictamente involucrados en procesos de fitopatogenicidad) (Aime y Phillips-Mora, 2005), metanol oxidasas y retrotransposones, genes CP01 relativos a mecanismos de defensa al igual que fosfoproteínas y proteasas, entre otras (Teixeira et al., 2014).
Asimismo, se observaron similitudes con los géneros Trichoderma y Tremella del reino Fungi, al sugerir la presencia de transcritos hipotéticos. Así, se sabe que durante su interacción biotrófica con el cacao, el género Moniliophthora expresa distintos alelos que codifican transcritos de interés biotecnológico (e.g. citoquininas deshidrogenasas, glicósido hidrolasas, proteínas I3, proteínas ricas en cisteína, peptidasas, transposasas y thaumatinas). Algunos de estos metabolitos se encuentran relacionados con procesos de fitopatogenicidad al igual que transposición replicativa y transcripción, y se involucran en rutas metabólicas que desencadenan respuestas sistémicas en la planta huésped (Jones y Dangl, 2006; Teixeira et al., 2014).
Hoy en día, aún con la atención prestada al estudio de las interacciones moleculares entre los géneros Theobroma y Moniliophthora, existe relativamente poca información respecto a la naturaleza del genoma y secretoma de este último fitopatógeno fúngico. Meinhardt et al. (2014) ensamblaron 52,3 Mb en 3,298 cóntigos que representan el genoma completo de M. roreri, prediciendo 17,920 ORF´s y validando 13,760 secuencias mediante RNA-seq. De los 1,535 genes que transcriben teóricamente proteínas, 1,355 de estos podrían transcribirse en fases biotróficas y necrotróficas. Igualmente, el análisis de datos revelados por el secretoma de M. roreri sugiere correlación con procesos de infección y crecimiento intercelular en la fase biotrófica, al igual que con el crecimiento invasivo y la correspondiente fase necrótica por parte del hospedador.
Mediante nuestro trabajo se predijeron distintos cóntigos en M. roreri con altos porcentajes de identidad respecto a secuencias de T. cacao (>95 %) (Tabla 1) previamente anotadas y, cuya predicción funcional refiere proteínas aun sin caracterizar, pero que podrían clasificarse como fosfoproteínas vasodilatadoras, proteasas y factores de transcripción cloroplásticos. Todos ellos involucrados en el metabolismo secundario del hongo. Tiburcio et al. (2010) sugieren que el género Moniliophthora posee al menos tres genes que han sido adquiridos mediante transferencia horizontal (HGT; horizontal gene transfer) (i.e. (1) proteínas inductoras de necrosis (NIPs; necrosis-inducing proteins), (2) hidrolasas dependientes de metal (MDH; metallo-dependent hydrolases) y (3) deshidrogenasas manitol fosfato (MPDH; mannitol phosphate dehydrogenase).
De acuerdo con esta información y analizando los resultados obtenidos de las respectivas reconstrucciones filogenéticas a partir de los cóntigos ensamblados de M. roreri CPMRT01 (Figuras 2, 3 y 4), aquí proponemos “hipotéticamente” que existe la posibilidad de que algunas de las regiones conservadas de los genes estudiados se heredarían de oomicetes, actinobacterias y firmicutes (i.e. con base a las supuestas anotaciones funcionales observadas que se relacionarían con especies diferentes y que son el resultado del proceso evolutivo de genomas que provienen de organismos antecesores comunes). A partir de este antecedente es que se propone la idea de una posible divergencia evolutiva interespecífica. Esto explicaría (aunque de manera muy limitada) la predicción hipotética de proteínas en nuestro trabajo que aun no han sido anotadas y que mostraron un alto porcentaje de similitud respecto a secuencias de aminoácidos de otros géneros, e inclusive, especies de otros reinos. Por otra parte, los aglomerados y subgrupos de taxones observados en los análisis correspondientes sugieren variación en su estructura nucleotídica y, la proximidad de cada componente dependería en gran medida de la naturaleza de dichas regiones nucleotídicas. De ser correcto lo anterior, un solo taxón representaría dentro de la población a los componentes con mayor rastro evolutivo, pues en principio; cada grupo de secuencias consenso forman inclusive clústeres subconjuntos (Ricaño-Rodríguez et al., 2018). Tomando en cuenta dichos resultados, los aglomerados restantes se encuentran directamente emparentadas con los cóntigos 4478, 2879, 4961 y 8564, aunque como se ha mencionado en repetidas ocasiones, las predicciones al ser heurísticas sólo sugieren una aproximación a la naturaleza genómica de la especie (Motamayor et al., 2013).
De los 12 genes tipo PR-1 identificados en el genoma de M. roreri, 10 de estos poseen similitud con secuencias descritas en M. perniciosa (Texeira et al., 2012). Estas proteínas se regulan durante la fase biotrófica, aunque también es posible observarlas en la fase necrotrófica. Todas las proteínas tipo MrPR-1 tienen al menos un dominio SCP conservado. El C-terminal de la proteína MrPR-1g que se encuentra tanto en M. perniciosa como en M. roreri tendrían una función específica en su fase fitopatogénica (Meinhardt et al., 2014), resultado que es consistente con la predicción de ciertos dominios conservados en el genoma de nuestra cepa (Figura 5). Otro dato importante es que; durante la interacción con plantas de cacao, el micelio de M. roreri tiene acceso a estructuras plasmodesmáticas y por consiguiente, a los nutrimentos que pasan a través de ellas. En este sentido, las proteínas tipo PR-1 son importantes para la virulencia, y se ha sugerido que intervienen en la diseminación sistémica del hongo, posiblemente limitando la susceptibilidad de defensa del huésped, actuando como efectoras que suprimen su mecanismo de defensa (Prados-Rosales et al., 2012).
Las proteínas PR-1 interaccionan también de manera independiente en las fases biotrofas y necrotrofas. Por otra parte, estos péptidos alteran las paredes celulares de Theobroma como si fueran inhibidores competitivos, minimizando la respuesta de defensa de la planta e inclusive mostrarían actividad antimicrobiana, para prevenir infecciones subsiguientes y el desarrollo de microorganismos competidores. En principio, este fenómeno sugeriría el planteamiento de una hipótesis que explique parte de las causas por las cuales Moniliophthora ha sido un agente causal de moniliasis en el estado de Tabasco, México, lo cual evidencia su alta capacidad de adaptación epigenética al medio ambiente, apoyando el viejo modelo propuesto de fitopatogénesis (Garcia et al., 2007).
Las proteínas secretadas en la fase biotrófica se asocian principalmente con la descomposición de la matriz intercelular del fruto de cacao, así como con el proceso de modificación de micelios fúngicos, posiblemente para enmascarar al hongo de la defensa de la planta. Igualmente, las proteínas que se hacen presentes en la fase necrotrófica atacan las paredes celulares de su huésped (Ricaño-Rodríguez et al., 2018). En virtud de lo anterior, a través del estudio de predicción de dominios conservados en el genoma de la cepa CPMRT01 se propone la presencia de sitios catalíticos relacionados con enlaces a histonas, ácidos nucleicos y NTP e hibridación ADN/ARN. Todos ellos serían factores moleculares importantes en la fase necrotrófica del hongo (Texeira et al. 2012; Meinhardt et al., 2014) y que soportarían una explicación plausible sobre el origen de la naturaleza virulenta del hongo al menos contra el género Theobroma.
Por último, cabe mencionar que el estudio genómico de esta especie fúngica permite desarrollar una mejor comprensión sobre cómo la interacción Moniliophthora-Theobroma concluye en una enfermedad vegetal progresiva, lo que se traduce en la necesidad de implementar nuevas herramientas que reduzcan su impacto agrícola en ambos sentidos; tanto económico como sociocultural.
Conclusiones
Hasta donde los autores sabemos, éste es uno de los primeros trabajos realizados en México donde se propone una aproximación heurística a la naturaleza genómica de una cepa de M. roreri aislada de frutos de cacao nativos del Estado de Tabasco, México. La evaluación de calidad de las lecturas de secuenciación generadas mostró distribuciones muy variadas y, los resultados de clasificación para las muestras guardaron relación con el organismo estudiado. Tanto los estudios de reconstrucción filogenética como las hipotéticas predicciones funcionales de regiones conservadas, permitirían identificar posibles alelos que aún no han sido reportados en el repositorio del NCBI, incluyendo proteínas transcritas tipo RP-1 asociadas a procesos de fitopatogenicidad. Lo anterior aportaría valioso conocimiento sobre la capacidad de adaptación de Moniliophthora a distintas condiciones ambientales. Los resultados de caracterización de dominios conservados y su consiguiente evolución molecular taxonómica, sugieren la reagrupación de cóntigos que teóricamente evolucionaron de manera conjunta a partir de un clado primario. Por otra parte, los marcos de lectura abierta de los cóntigos estudiados codificarían en principio; superfamilias de proteínas ricas en cisteína, peptidasas tipo S8 y transposasas tipo Tnp4, por citar a las más relevantes.