Introducción
En México, el cultivo de caña de azúcar es una actividad agrícola de relevancia económica, que se produce en 227 municipios ubicados en 15 estados, en los cuales se concentra el 13% de la población nacional (más de 3 millones de personas dependen directa e indirectamente de su cultivo y transformación); genera el 0.5% del producto interno bruto (PIB) nacional: 8.9% del PIB del sector agropecuario, el 2.4% de la industria manufacturera. México es el séptimo productor mundial de azúcar y en la zafra 2005-2006 la superficie sembrada fue de 659 124 ha, con una producción total de caña molida alrededor de los 47 290 412 Mg, significando una producción azucarera de 5 282 088 Mg, con rendimientos de fábrica del 11.17% y de campo de 71.75 Mg ha-1 (Aguilar-Rivera, 2007; Aguilar-Rivera et al., 2009).
Sin embargo, la operatividad, competitividad y contribución al impulso de la capacidad fabril para su molienda, presenta enormes desafíos emanados de la histórica crisis estructural y múltiples contradicciones coyunturales aún presentes en el sector cañero mexicano (Banko, 2005; Domínguez, 2005), con consecuencias negativas tales como: infraestructura y tecnología agroproductiva poco eficientes (Aguilar-Rivera, 2007), elevados costos de producción (Enríquez, 2008) y uso exiguo de los productos y subproductos obtenidos en el ingenio azucarero y la destilería (Aguilar-Rivera, 2007), sin desestimar la capacidad organizativa de los productores e insuficiente planificación operativa de la siembra, las labores culturales y la recolección (corte, alza, transportación y recepción) de la caña de azúcar (Infante y Vázquez, 2001).
De este modo, carecer de un programa de planeación y control sistemático de procedimientos de operación, implica el fracaso de cualquier esfuerzo tendiente a fomentar la sustentabilidad de los procesos agroproductivos y de la transformación de la caña de azúcar. En consecuencia, para promover la instalación de un ingenio azucarero exitoso, se requiere la reordenación de la superficie cañera sembrada en sitios donde las condiciones agroecológicas garanticen de algún modo la productividad (GEPLACEA, 1991; Aguilar et al., 1996; Jiménez et al., 2004; Aguilar-Rivera et al., 2009).
Así, cabe señalar que algunos de los programas utilizados para realizar el pronóstico de la producción de caña de azúcar mediante el método de Box-Jenkins han sido EViews (Rodríguez, 2001), TRAMO/SEATS (Kikut et al., 2002) y SPSS (Gómez et al. 2007).
En el caso de las aplicaciones para la predicción de cosechas en caña de azúcar, el programa “Pronóstico de riego” permite valorar los requerimientos de agua de las distintas variedades comerciales (tempranas, medianas y tardías), a través de un modelo de regresión múltiple, donde se utilizan variables climáticas con el fin de conocer el rendimiento potencial de este cultivo (Cañamero y Helfgott, 2009). Sin embargo, los autores no pronosticaron el valor futuro de la producción.
En otro estudio, Bonilla et al. (2003) incluyeron el excedente económico en los rendimientos agrícolas de la caña de azúcar, en términos de su comportamiento en el mercado interno y externo, valiéndose de un modelo estocástico para analizar el impacto del fenómeno meteorológico El Niño Oscilación del Sur (ENSO) sobre el sector azucarero colombiano. Así, a partir de su correcta estimación, las ganancias obtenidas han llegado a ser equivalentes al 1% del PIB de Colombia en el año 2000, situación que de ninguna manera aplica para el sector azucarero de Queensland, Australia, pues no se tiene la certidumbre de que el comportamiento agronómico de la gramínea sólo sea atribuida a la influencia del fenómeno meteorológico citado (Kuhnel, 1993).
En este sentido, Martínez y Martínez (1996) idearon un método computacional a través del cual con datos de precipitación y temperatura registrados durante 38 años en el corredor cañero de Mante-Xicoténcatl, en Tamaulipas, México, pronosticaron la época óptima de zafra en la zona.
Por otro lado, O’Leary (1999, 2000) hizo la revisión de tres modelos de simulación usando datos medioambientales para determinar el rendimiento promedio anual de sacarosa en la caña de azúcar sin aplicar las series de tiempo.
Por otro lado, Rodríguez (2001) analizó el comportamiento de la producción del edulcolorante en Cuba tomando como base los datos reales registrados entre 1900-1998, periodo durante el cual tuvieron que subdividir la serie de tiempo en cinco etapas tras detectar que los cambios histórico-políticos y sociales del país son factores que influyeron en la aplicación de los modelos Box-Jenkins para las investigaciones estadísticas y la realización de pronósticos.
En la Dirección de Estudios Agropecuarios y Pesqueros (DGEAP) de la SAGARPA (2009), en colaboración con el AFPC (Agriculture and Food Policy Center) y el FAPRI (Food and Agricultural Policy Research Institute) implementaron un modelo de proyecciones macroeconómicas a favor del sector agropecuario nacional, entre los cuales el escenario base para la caña de azúcar1 matiza la prospectiva del impacto de cambios en la política pública o en la combinación de factores y circunstancias inherentes al periodo estimado para el 2009 en el ámbito cañero-azucarero.
Además, se dispone de la proyección nacional de siembra, producción de azúcar, rendimiento (en campo y fábrica) y consumo (interno y externo) para el periodo 2007-2012 (SAGARPA, 2007), así como también de un estudio donde se puntualizan aspectos cruciales para extraer la mayor cantidad de sacarosa (porcentaje de azúcar) de la caña por el tándem2 (Gómez et al., 2007).
No obstante, en la literatura consultada, se hace mención respecto a la insuficiente disponibilidad de investigaciones donde se perfeccionan las técnicas y se sistematizan los procedimientos para pronosticar con mayor precisión la zafra en los ingenios azucareros del mundo (Gómez et al., 2007), encontrándose en la mayor parte de los estudios consultados, muy pocas investigaciones sobre simulación para el sector azucarero, además del inconveniente de que los modelos que se utilizan son estacionarios (Merino et al., 2009). Tal situación, no es distinta en México, pues a pesar de contar con diversos pronósticos relacionados con la producción cañera no se reportan las metodologías aplicadas (SIAP-SAGARPA, 2009). Es por ello, que en el presente trabajo se planteó como objetivo proponer un modelo de series de tiempo que pronostique la zafra 2006-2007 del ingenio Independencia.
Materiales y métodos
El ingenio Independencia se encuentra ubicado en la porción central del estado de Veracruz, y su área de influencia comprende 20 818 ha distribuidas en los municipios de Misantla, Nautla, Vega de Alatorre, Atzálan, Tlapacoyan y Martínez de la Torre, pero principalmente en este último (SAGARPA, 2009), en las coordenadas 20° 04’ N 97° 03’ O donde prevalecen temperaturas promedio de 24 °C y una precipitación pluvial media anual de 1508.9 mm.
Dicho cañamelar y oficinas de beneficio se han caracterizado por generar fuentes de empleos para todas las comunidades ubicadas a su alrededor, convirtiéndose en la principal fuente de ingresos para más de cinco mil familias asentadas en esa región geográfica. Este Ingenio, se encuentra en una región de gran extensión citrícola que se inició a partir de los años 70’s (Hoffman y Velázquez, 1993).
Los métodos de series de tiempo estiman o pronostican el dato más inmediato de la serie de datos estudiada, para lo cual es indispensable trabajar con antecedentes históricos (pasados), los cuales se caracterizan por ser información dispuesta para su tratamiento por una computadora (Martínez, 2005). Así, en este trabajo se utilizó la serie de tiempo conformada por las zafras del ingenio Independencia y, con ellas, se generó una base de datos en el programa Statistica3 con las siguientes variables: año (periodo del ciclo agrícola) que representa las zafras iniciadas en el mes de noviembre y finalizadas en el mes de julio del año siguiente, motivo por el cual, ésta serie de tiempo incluyó 57 datos, que correspondieron a las zafras del periodo de 1949-1950 a 2005-2006, en las que se registró su correspondiente producción de azúcar (toneladas).
Si bien en este trabajo se rebasa el número de datos requeridos en el programa TRAMO/SEATS para estimar un modelo para el ajuste de criterios y valores de convergencia (36 observaciones) (Kikut et al., 2002), en la SAGARPA se usó una serie que comprende los años 2000 al 2006 para realizar el pronóstico de rendimientos a nivel nacional de la zafra 2006-2007 (SIAP-SAGARPA, 2009); y en Pakistán utilizaron 55 datos correspondientes al periodo de zafras de 1947 al 2002 (Yassen et al., 2005).
Las fuentes consultadas para conocer el volumen de las zafras de 1949 al 2002 y de 2003 al 2006 fueron el archivo personal de la administración general del ingenio Independencia y el informe anual de la CNIAA (2008), respectivamente. La metodología de Box-Jenkins se aplicó a esta serie de tiempo para pronosticar la producción de azúcar, correspondiente a la zafra 2006/2007 (Box et al., 1994).
En el modelo autoregresivo integrado de medias móviles (ARIMA) (p, d, q) utilizado en este estudio, se consideró a p como el parámetro autoregresivo, d al número de fases de diferenciación no estacionales y q al parámetro de medias móviles (Yassen et al., 2005); a este modelo se le evaluaron los siguientes supuestos: 1) la media de los residuales es igual a cero; 2) varianza constante de los residuales; 3) independencia de los residuales; 4) normalidad de los residuales; 5) observaciones aberrantes; 6) el modelo es parsimonioso; 7) el modelo es admisible, y 8) el modelo es estable (Rodríguez, 2001).
Resultados y discusión
La producción de azúcar durante las zafras 1949-2006 del ingenio Independencia se presentan en la Figura 1, contrario a las series de tiempo que utilizaron 38 y 39 datos (Martínez y Martínez, 1996; Sinha y Cherkauer, 2008), en este análisis se usaron 57 datos. Las zafras del ingenio Independencia no tienen tendencia alguna, estacionalidad, ni tampoco observaciones aberrantes, pero muestra un comportamiento no estacionario en media ni tampoco en varianza (Cuadro 1). Por ello, se realizó una transformación a la variable producción.
En el Cuadro 1 se presentan las estadísticas descriptivas de la serie de tiempo, desde que se describió la serie original (x = PROD), se le aplicó la transformación logaritmo natural ln(x); además se realizó la diferenciación ln(x); D(-1), y por último se volvió a aplicar otra diferenciación ln(x); D(-1); D(-1) (Nochai y Nochai, 2010).
De este modo, cuando a la serie se le aplicó cada una de las diferenciaciones a la variable transformada, la desviación estándar fue disminuyendo (Cuadro 1), lo cual indica que es más apropiado trabajar la serie solamente con dos transformaciones. Sin embargo, en la Figura 2 se aprecia que el comportamiento de la transformación ln(x); D(-1); D(-1) es apropiada para generar la serie, ya que no sigue ningún patrón, es decir, no presenta tendencia alguna y ello indica que la serie es estacionaria en media y varianza (Nochai y Nochai, 2010).
El modelo ARIMA (1, 2, 0) que se representa en la Ecuación 1 y el modelo estimado mostrado en la Ecuación 2, cumplió con los ocho supuestos, como ocurrió en el trabajo realizado en Cuba en la aplicación de las series de tiempo estructuradas a un proceso industrial para contribuir a la reducción de variabilidad de extracción de la empresa azucarera Melanio Hernández (Gómez et al., 2007).
donde:
Z t = producción de caña de azúcar pronosticada para la próxima zafra
φ1 = valor estimado del parámetro del modelo autoregresivo de orden 1
δ = constante
ut ~ N (0, σ2); ut = 0
En el Cuadro 2 se presenta la estimación de los parámetros del modelo ARIMA (1, 2, 0), obtenido con el programa Statistica.
Fuente: Elaboración propia a través del análisis de series de tiempo con el programa Statistica. p = valor verdadero de probabilidad para rechazar H0; AR(1) = valor del modelo autorregresivo de orden 1.
De esta manera, se sustituyeron los valores de los parámetros del modelo en la Ecuación 1 y se obtuvo el siguiente modelo ARIMA(1,2,0)
Donde: ut ~ N (0, 0.07566)
Los resultados obtenidos del programa Statistica del modelo ARIMA (1, 2, 0) se muestran en el Cuadro 3 y se representaron en la Ecuación 1. El pronóstico de la producción se realizó con los datos de la serie estudiada y con ella se pronosticó la zafra 2006-2007 y posteriormente, el modelo incluyó ese dato y al utilizar éste junto con los anteriores, se obtuvo el pronóstico del siguiente año, y así sucesivamente se realizaron los pronósticos de las zafras de los años siguientes (Yassen et al., 2005).
Se observa que la producción del ingenio Independencia disminuye año tras año, lo cual se asocia a la baja producción mundial y nacional de la caña de azúcar, aunado al incremento de precios en el corto y mediano plazo, como lo manifiestan Vergara y Díaz (2010) al plantear un escenario poco optimista para México.
De acuerdo con el modelo ARIMA (1, 2, 0), el pronóstico de la zafra correspondiente al ciclo 2006-2007 para el ingenio Independencia de Martínez de la Torre, es de 11 974.06 Mg de azúcar y la producción real de la zafra de referencia 2006-2007 fue de 12 736 Mg (SIAP-SAGARPA, 2010). El presente modelo fue diferente en los parámetros al modelo ARIMA (2, 1, 2) utilizado en Pakistán, el cual analizó los datos de las zafras 1947 a 2002, y se obtuvieron pronósticos aproximados a los reales como ocurrió en este estudio (Yassen et al., 2005).
El pronóstico de la producción se aproximó en un 94% a la producción real, lo cual muestra que el modelo es eficiente. Al comparar el valor de la producción pronosticada con el valor real, se deben de considerar los aspectos que influyen en la variable analizada como ocurrió en el ciclo 2005-2006 con la superficie industrializada que fue de 2848 ha (SIAP, 2010) en relación al ciclo 2006-2007, de 2804 ha. Esta situación hizo que disminuyera en un 1.5% la superficie industrializada.
Otro pronóstico a nivel nacional, lo obtuvo la SAGARPA en la zafra 2006-2007 en el que se incrementó la producción de 47 290.4 a 48 620 miles de toneladas, los rendimientos de 71.750 a 73.767 (Mg ha-1) y la superficie cultivada de 659.1 (miles de hectáreas) permaneció constante (SIAP-SAGARPA, 2009).
Otros factores que de una u otra manera pudieren influir en la estimación de la zafra son la interacción genotipo-ambiente (Marcano et al., 2003; Bonilla et al., 2003; Jiménez et al., 2004; Lawes y Lawn, 2005).
En el análisis de la serie de tiempo considerada en este estudio se tomó en cuenta el periodo completo de zafras (1949-2006), a diferencia de Rodríguez (2001), quien en su investigación la subdividió en cinco etapas al considerar el impacto de los aspectos políticos y socioeconómicos que han prevalecido en Cuba, lo cual no tiene sentido, al pronosticar un valor del pasado, cuando la finalidad de los modelos de series de tiempo son pronosticar el dato futuro inmediato a través de los datos de esa variable considerados en el periodo de la serie de tiempo estudiada. En relación a los resultados obtenidos y a los registrados en bibliografía, se concluye que el uso de los métodos estadísticos en la estimación o pronóstico de la producción de la caña de azúcar, son útiles en la toma de decisiones y en la planeación del sistema de producción de caña de azúcar (Lawes y Lawn, 2005).
Conclusiones
- Se concluye que el modelo autoregresivo integrado de medias móviles (ARIMA) (1, 2, 0) propuesto, fue el apropiado en el pronóstico de la zafra 2006/2007 del ingenio Independencia de Martínez de la Torre, Veracruz, México, y este resulta de gran de utilidad en la toma de decisiones para el mismo.
- Este trabajo muestra la importancia de introducir los métodos de series de tiempo en el análisis de pronósticos productivos de la agroindustria azucarera, con el objetivo de contribuir a una mejora sustancial en la planeación productiva de los ingenios azucareros, optimizando los recursos existentes y evitando pérdidas futuras en el mercado.