Introducción
La calidad de la información almacenada en las oficinas de gobierno, institutos de educación e investigación, es de gran importancia para poder enfrentar distintos problemas y tomar decisiones a todas las escalas, incluso a nivel global (por ejemplo: cambio climático, cambio de uso de suelo, introducción de especies exóticas) (Díaz et al., 2006). En el mundo existen bases de datos de vegetación que permiten evaluar la diversidad, el control de malezas, la deforestación, entre otros, actualmente, han surgido varias iniciativas para el manejo y acceso a la información de diversas colecciones científicas (Cayuela et al., 2012). Sin embargo, para compartir bases de datos a nivel internacional es necesario reducir los errores que existen en éstas para su correcto uso en distintos proyectos, por ejemplo: análisis de diversidad o inventarios de carbono.
Los principales problemas de este tipo de bases de datos están asociados a conceptos taxonómicos o a la referenciación geográfica (Mas y Fernández, 2003; Chapman 2005; Jansen y Dengler 2010). Dengler et al. (2011) refieren que los errores de nomenclatura en el manejo de distintas bases de datos pueden producir errores en las medidas de diversidad y riqueza, sin embargo, se les ha dado poca atención en las bases de datos (Jansen y Dengler, 2010); la taxonomía de plantas es una disciplina dinámica donde las especies cambian frecuentemente de nombre por la reconsideración de conceptos genéricos o específicos o, en algunos casos, por errores de nomenclatura (Stuessy 2009; Cayuela et al., 2012). Uno de los resultados es que con el tiempo se generan sinonimias debido a que la misma especie ha sido descrita por distintos autores con diferentes nombres científicos.
Los inventarios forestales son una de las bases de datos de vegetación más utilizadas en el mundo. Desde 1992, numerosos países suscribieron el programa ambiental Estrategia de Biodiversidad Mundial en Río de Janeiro (Rondeux, 1999), donde los inventarios forestales adquirieron un estatus de obligatoriedad entre los países signatarios. En México, se han realizado esfuerzos para generar inventarios de especies forestales desde 1961: Primer Inventario Nacional Forestal 1961 - 1985, Inventario Nacional Forestal de Gran Visión 1991, Inventario Nacional Forestal Periódico 1994 (Caballero, 1998) y el Inventario Forestal Nacional 2000 (SEMARNAT, 2002). Tres años después, se promulgó la Ley General de Desarrollo Forestal Sustentable, en la que se establece que el país debe contar con instrumentos para fortalecer la política nacional forestal como lo es el Inventario Nacional Forestal y de Suelos (INFyS) (SEMARNAT, 2003).
La colecta de datos de campo del INFyS se realizó entre 2004 y 2007. Se levantaron 24 mil 659 conglomerados, que integraron, a su vez, 81 mil 665 sitios de muestreo distribuidos geográficamente en todas las áreas con vegetación del país. La información de campo obtenida sobre las condiciones del terreno y especies de árboles, arbustos y hierbas en los bosques, selvas, matorrales, pastizales y otros tipos de vegetación (CONAFOR, 2012a), se incorporó a la información cartográfica de uso del suelo y vegetación, a escala 1:250 000, serie IV, del Instituto Nacional de Estadística y Geografía, la cual se fundamenta en imágenes de satélite SPOT capturadas en 2007 (CONAFOR, 2012a), permitiendo el uso de los datos para un análisis dinámico del estado de los recursos forestales del país, mediante el monitoreo y comparación de inventarios (CONAFOR, 2001).
Los datos taxonómicos son cada vez más fáciles de obtener a través de internet (por ejemplo: EOL; National Museum of Natural History, 2013). La base de datos internacional, The plant list (2013), es una autoridad botánica aceptada y con acceso libre, elaborada con la colaboración de Royal Botanic Gardens (Kew) y del Missouri Botanical Garden (MBG), entre otras instituciones alrededor del mundo (Cayuela et al., 2012). Todas estas contribuciones incrementan la calidad de la identificación de especies y crean una base de datos global que se puede compartir a nivel internacional. No obstante, la depuración de inventarios antiguos, mediante la consulta de The plant list (2013), es un proceso lento y falible si se realiza en forma manual (Cayuela et al., 2012). La implementación de algoritmos y herramientas computacionales es imprescindible para que los datos estén disponibles a tiempo para la efectiva toma de decisiones sobre manejo y conservación de los recursos forestales.
El lenguaje R, con más de 5000 paquetes disponibles, es ampliamente usado por biólogos (Chamberlain y Szöcs, 2013). Son cada vez más frecuentes los paquetes con una interfase de programación (API siglas en inglés) para establecer una conexión con información disponible en internet (por ejemplo: taxize, ape y taxonstand). El paquete Taxonstand version 1.0 (Taxonomic standardization of plant species names), dentro del ambiente gratuito R, estandariza automáticamente los nombres de las plantas de una base de datos, utilizando los registros del sitio The plant list (2013), mediante un flujo concatenado de pasos sobre cada uno de los nombres encontrados en la base analizada, que consiste en localizar las inconsistencias entre ésta y la base de referencia (Cayuela et al., 2012; R Development Core Team, 2012).
El objetivo del presente trabajo fue evaluar la lista de especies presentada en el Informe de Resultados 2004-2009 del INFyS (CONAFOR, 2012a), para cuantificar los errores en la escritura de los nombres científicos, identificar las sinonimias y encontrar especies inexistentes, mediante la implementación del paquete Taxonstand en ambiente R. Así como, el impacto de las correcciones sobre la estimación de la riqueza y la diversidad de especies, así como el tiempo requerido para el análisis, lo que permitirá considerar la viabilidad de su uso en futuros proyectos.
Materiales y métodos
Base de Datos
El Informe de Resultados del INFyS 2004-2009 está conformado por un libro, tablas de resultados, anexos, una malla de puntos de muestreo y cartografía temática. Se utilizó la información de tres columnas del Anexo 3 Catálogo de especies registradas en el INFyS 2004-2009: género, epíteto específico y forma biológica (CONAFOR, 2012b).
Análisis en Taxonstand
El archivo se exportó a una hoja de Excel, que contenía las columnas descritas anteriormente. Esta base de datos de nombres científicos se evaluó con el paquete Taxonstand en el ambiente R (Cayuela, 2012).
Se analizaron 3374 registros de especies vegetales publicados en el Informe de Resultados del INFyS con la función TPL (database, corr = T) para verificar los datos en la base The plant list, 2013 (Figura 1) y obtener los resultados: (1) Estandarización de la nomenclatura (Plant.Name.Index), con valores TRUE (verdadero) o FALSE (falso) para las especies que están o no en TPL; reemplazando los sinónimos con los nombres actuales aceptados (reconocidos por grupos de especialistas) y almacenando el nombre original en un campo separado. (2) Taxonomic.status: Accepted (nombres científicos de las especies correctamente escritas), Synonyms (el nombre utilizado es un sinónimo y Taxonstand lo remplaza por su nombre científico aceptado) y Unresolved (aquellas especies que no se les ha asignado ningún estatus, (esto es: aceptado o sinonimia). (3) Después del análisis, todas las especies con estatus de Plant.Name.Index = FALSE fueron reanalizadas directamente en el MBG. Finalmente, todas las especies con estatus de Plant.Name.Index = TRUE y con Taxonomic.status = Unresolve' fueron consideradas especies nuevas (Figura 1).
La mayor parte de la metodología se desarrolló con el paquete Taxonstand mediante su algoritmo interno (Cayuela, 2012); el análisis en el MNG de las Plant.Name.Index = FALSE es la única recomendación independiente de validación, ya que el paquete Taxonstand en la versión 1.0, no realiza correcciones a nivel de género.
Análisis de Riqueza y Diversidad
Se cuantificó la riqueza de especies (S) y diversidad Shannon (H) de acuerdo con las especies registradas en el Informe de Resultados del INFyS, antes y después de corregir la nomenclatura taxonómica con el paquete Taxonstand. La riqueza y diversidad se determinaron con la funciones specnumber y diversity (usando logaritmo natural) respectivamente con el paquete vegan (Oksanen et al., 2011) dentro del ambiente R. (R Development Core Team, 2012).
Resultados
Riqueza y Diversidad
El Informe de Resultados del INFyS 2004-2009 reportó un total de 3374 especies (CONAFOR, 2012b). Después de analizar la base de datos, se encontró que el número real de especies es de 2996, al encontrar 376 sinonimias y cinco especies inexistentes. La diversidad, medida como índice de diversidad de Shannon (logaritmo natural), fue de 8.12 previo al análisis de Taxonstand y 8.0 después del análisis (Cuadro 1).
Sinonimias
De las 376 sinonimias totales identificadas, dos especies presentaron cinco sinónimos (por ejemplo: Casearia corymbosa tuvo cinco sinonimias: C. arguta, C. dolichophylla, C. laevis, C. nítida y C. pringlei); 10 especies, tres; 44 especies, dos; y 248 especies, una (Anexo 1 = synonym.pdf).
Discusión
La definición jurídica del INFyS y su creación mediante un decreto presidencial, exigen que los resultados contengan información precisa y actualizada sobre la cuantía, ubicación y condiciones de los recursos forestales que existen en México (CONAFOR, 2012a). Los errores que se presentaron en la nomenclatura científica del Catálogo de Especies Vegetales del INFyS (Cuadro 1), suscita una sobreestimación de la diversidad y riqueza (Isaac et al., 2004; Dengler et al., 2011), por lo tanto, se recomienda efectuar este análisis previo a la publicación del siguiente INFyS a fin de presentar resultados que permitan análisis precisos.
La información proporcionada por el INFyS es crucial para la planificación estratégica y las evaluaciones periódicas de los recursos forestales en México (CONAFOR, 2012a). Es por ello, que los errores en la nomenclatura pueden tener impactos a diferentes escalas: a nivel nacional, los errores afectan en las estimaciones de carbono contenido en la biomasa área forestal, debido a que los cálculos se realizan con base en características de las especies (Schroeder et al., 1997; Acosta et al., 2002; Fukuda et al., 2003; Rojas y Villers, 2008). De igual forma los programas para la protección y combate de incendios forestales se sustentan en las propiedades de las especies forestales en su calidad de combustibles (Muñoz et al., 2005; Wong y Villers, 2007).
Por otro lado, la metodología aplicada en el INFyS se homologó a las utilizadas en Canadá y Estados Unidos de Norteamérica, de esta forma México ha conseguido reportar el estado de los recursos forestales a nivel internacional, de acuerdo con lo solicitado cada cinco años por la Organización de la Naciones Unidas para la Agricultura y la Alimentación (FAO), en su reporte de Evaluación de los Recursos Forestales Mundiales (Orozco et al., 2010). Así mismo, el INFyS alimenta al Inventario Nacional de Gases de Efecto Invernadero, particularmente en la categoría de Agricultura, Silvicultura y otros Usos de la Tierra (De Jong et al, 2009). Por lo tanto, la reducción de errores aportará mayor exactitud en los inventarios e informes mundiales, principalmente porque cada especie vegetal tiene diferente capacidad de almacenamiento de carbono (Penman, 2003).
El INFyS es un proceso que se mantiene en mejora continua para garantizar la optimización de los recursos y la utilización de técnicas y tecnologías de vanguardia que se transformen en mejores resultados, aprovechando las ideas y aportaciones de expertos y de los usuarios en general, en un ejercicio de retroalimentación permanente (CONAFOR, 2012a,b). La normalización, validación y verificación de los resultados del INFyS que garanticen el uso de datos de calidad, adquieren especial interés en la gestación de la Estrategia Nacional para la Reducción de Emisiones por Deforestación y Degradación de los bosques, uno de los puntos más importantes en el debate sobre el cambio climático.
En el presente trabajo se describe una metodología para la depuración del Catálogo de especies vegetales del INFyS, con base en el uso del paquete Taxonstand (Figura 1), el cual permite la validación de los datos por la fuente de información respaldada por las autoridades taxonómicas (The plant list, 2013) para conocer el estatus de cada especie y su correcta escritura. El uso de The plant list con el paquete Taxonstand corrigió errores del INFyS (Cuadro 1), los cuales afectaban en 1.5% la Diversidad de Shannon y sobreestimaban la riqueza (376 especies fueron corregidas).
La estandarización taxonómica debe ser un paso previo importante en los análisis de inventarios nacionales e internacionales (Cayuela et al., 2012), sin embargo, puede consumir gran cantidad de tiempo. La automatización que realiza el paquete Taxonstand puede reducir esta tarea. R y Taxonstand están bajo Licencia de documentación libre de GNU, lo cual permite compartir y distribuir el software completamente libre (Cayuela et al., 2012). Por lo tanto, el análisis presentado aquí puede ser elaborado en cualquier etapa de la investigación por cualquier persona o instituto.
Se recomienda que se analicen por separado todas las especies que resulten con el estatus Plant.Name.Index = FALSE (65 especies en este trabajo, es decir, aproximadamente el 2% de todas las especies reportadas originalmente).
El uso del paquete Taxonstand permite conocer las sinonimias de cada especie. Este análisis resulta de utilidad en estimaciones de biomasa almacenada en bosques y otras comunidades vegetales. Esta cuantificación se realiza con el uso de ecuaciones alométricas que son generadas de forma específica. Conocer los taxones sinónimos de una especie, amplía el número de individuos cuya biomasa puede ser estimada con un modelo alométrico.
La aplicación de la metodología propuesta en éste trabajo puede servir para depurar cualquier base de datos de vegetación, pero también puede ser incluida como parte de los procesos dinámicos para su construcción, apoyando con información validada a la toma de decisiones e investigaciones con intereses de conservación, manejo comercial o evaluaciones de riesgo o impacto ambiental.
Conclusiones
En la validación y depuración del Catálogo de Especies Vegetales registradas en el INFyS 2004-2009, se encontró una sobreestimación de la riqueza y la diversidad ocasionada, principalmente, por errores de sinonimias y ortográficos. Se comprobó que el uso de herramientas gratuitas, como el paquete Taxonstand en R, permiten validar bases de datos de especies vegetales, lo que se traducirá en el uso eficiente de recursos destinados a la construcción y actualización de bases de datos con información más precisa. Se recomienda que organizaciones públicas y privadas que proveen bases de datos compartidas, hagan una revisión sistemática de sus especies con la metodología propuesta, previo a su publicación.