Introducción
Las temperaturas máximas y mínimas son importantes en la estimación de la evapotranspiración de referencia (Hargreaves & Samani, 1985; Segura-Castruita & Ortiz-Solorio, 2017), para el cálculo del requerimiento de riego en los distritos de riego. También se emplean para la detección local del cambio de la temperatura (Lobato-Sánchez & Altamirano-Del-Carmen, 2017) que afecta la evapotranspiración de los cultivos. De igual manera presentan una marcada influencia en todos los procesos fisiológicos del crecimiento y desarrollo de las plantas (fotosíntesis o respiración), y son importantes por los efectos perjudiciales en los cultivos (Elías & Castellví, 2001).
Las redes neuronales artificiales son un modelo de pronóstico útil, dado la alta no linealidad que manejan. Cobaner, Citakoglu, Kisi & Haktanir (2014) para estimar las temperaturas mensuales mínimas, máximas y medias del aire en Turquía, se utilizaron una red neuronal artificial, un sistema de inferencia neuro-fuzzy y un modelo de regresión lineal múltiple o el planteamiento de Alexandridis & Zapranis (2013) de una red neuronal Wavelet para modelar la temperatura media diaria.
Otros modelos también se han utilizado para estimar la temperatura, de forma horaria, diaria o mensual, por medio de regresiones lineales múltiples con variables predictivas como: latitud, longitud, altitud y continentalidad. Estos son planteamientos clásicos para la modelación de la temperatura (Monestiez, Courault, Allard, & Ruget, 2001 y Cristóbal, Ninyerola, & Pons, 2008).
Por otra parte Thornley & France (2007) indican que la temperatura del aire tiene un comportamiento sinusoidal, por lo tanto es factible utilizar para su estimación un modelo de series de Fourier. El objetivo fue pronosticar las temperaturas máxima y mínima diaria del aire con redes neuronales artificiales para diferentes escenarios y funciones de transferencia (purelin y tansig) y comparar los mejores resultados con los obtenidos por el modelo de serie de Fourier para su uso en diferentes aplicaciones.
Materiales y métodos
La información diaria de temperaturas máximas y mínimas (abril 1997 a diciembre de 2001) fue obtenida de cuatro estaciones meteorológicas automáticas (EMAS), del Distrito de Riego 075 Valle del Fuerte, en Los Mochis, Sinaloa, cuyos nombres (clave), latitudes, longitudes y altitudes son: Ruiz Cortínez (3843 II-2), 25° 39’ 15”, 108° 45’ 20”, 31 msnm; Batequis (3546 II-3), 25° 45’ 49”, 108° 48’ 41”, 32 msnm; AC Santa Rosa 1 (3765 III-1), 25° 45’ 03”, 108° 57’ 21”, 40 msnm; AC Santa Rosa 2 (9610 III-1) 25° 51’ 16”, 108° 52’ 03”, 61 msnm.
Para obtener el modelo de serie de Fourier se utilizó el Curve Fitting Tool de Matlab (MathWorks Inc., 2001). El software para entrenamiento, validación, prueba y pronóstico de la red neuronal artificial fue el Toolbox de Matlab®, nnet (Demuth & Beale, 2001).
Modelo de serie de Fourier
Con los datos de abril de 1997 a mayo de 2001 se generaron los modelos de serie de Fourier y de junio a diciembre de 2001 se utilizaron para la validación de estos. La variable de entrada fue día juliano, y la salida, temperatura máxima o mínima.
La ecuación para la serie de Fourier presentada por Dubbel (1977) es:
donde: a 0 , 𝑎 𝑖 y 𝑏 𝑖 son las constantes de la serie de Fourier, para i = 1
oscilación u onda fundamental, y para i = 2, 3,…..n, ondas superiores o
armónicas superiores, w es la frecuencia fundamental de la señal, n es el número
de términos (armónicas) en la serie, y en este caso:
Redes neuronales artificiales
En la red neuronal artificial se aplicó el algoritmo backpropagation (Haykin, 1994).
Para el entrenamiento, evaluación y validación se utilizaron los datos diarios de temperaturas máximas o mínimas de abril de 1997 a mayo de 2001 y para el pronóstico de junio a diciembre del 2001. Las variables de entrada son: día juliano, longitud, latitud y altitud, y de salida: temperaturas máximas o mínimas.
Las estructuras de los 96 diferentes escenarios para los entrenamientos de la red neuronal backpropagation se muestran en la Tabla 1, se combinó número de capas y número de neuronas en éstas, se utilizaron dos diferentes algoritmos de entrenamiento.
Evaluación estadística de los resultados de los modelos
Se utilizó el error estándar promedio (RMSE, por sus siglas en inglés), su
ecuación es:
Cuatro entradas para la RNA (día juliano, latitud, longitud y altitud) | |||
---|---|---|---|
Escenarios 1 {e1} | Escenario 2 {e2} | Escenario 3 {e3} | Escenario 4 {e4} |
Salida Tmax (función): f(tansig) para {e1} | Salida Tmax (función): f(tansig) | Salida Tmax (función): f(purelin) para {e3} | Salida Tmax (función): f(purelin) |
Salida Tmin (función): f(tansig) para {e1} | Salida Tmin (función): f(tansig) | Salida Tmin (función): f(purelin) para {e3} | Salida Tmin (función): f(purelin) |
Algoritmo de entrenamiento trainlm | Algoritmo de entrenamiento trainlm | Algoritmo de entrenamiento trainlm | Algoritmo de entrenamiento trainbr |
{neuronas} | {neuronas} | {neuronas} | {neuronas} |
1 capa oculta f{tansig} | - | 1 capa oculta f{tansig} | 1 capa oculta f{tansig} |
{4} | - | {4} | {4} |
{8} | - | {8} | {8} |
{12} | - | {12} | {12} |
{16} | - | {16} | {16} |
{20} | - | {20} | {20} |
{24} | - | {24} | {24} |
{28} | - | {28} | {28} |
{32} | - | {32} | {32} |
{36} | - | {36} | {36} |
{40} | - | {40} | {40} |
2 capas ocultas, f{tansig}xf{tansig} | 2 capas ocultas f{tansig}xf{tansig} | 2 capas ocultas, f{tansig}xf{tansig} | 2 capas ocultas f{tansig}xf{tansig} |
{4x4} | {8x4} | {4x4} | {8x4} |
{8x8} | {12x4} | {8x8} | {12x4} |
{12x12} | {16x8} | {12x12} | {16x8} |
{16x16} | {20x8} | {16x16} | {20x8} |
{20x20} | {24x16} | {20x20} | {24x16} |
{24x24} | {28x16} | {24x24} | {28x16} |
{28x28} | {32x16} | {28x28} | {32x16} |
{32x32} | {36x20} | {32x32} | {36x20} |
{36x36} | {40x20} | {36x36} | {40x20} |
{40x40} | - | {40x40} | - |
3 ocultas f{tansig}xf{tansig}xf{tansig} | - | 2 capas ocultas, f{tansig}xf{tansig} | 3 capas ocultas, f{tansig}xf{tansig}xf{tansig} |
{4x4x4} | - | 8x4 | {8x8x4} |
{8x8x8} | - | 12x4 | {8x12x4} |
{12x12x12} | - | 16x8 | {8x16x4} |
{16x16x16} | - | 20x8 | {8x20x4} |
{20x20x20} | - | 24x16 | {8x24x8} |
{24x24x24} | - | 28x16 | {8x28x8} |
{28x28x28} | - | 32x16 | {16x32x16} |
{32x32x32} | - | 36x20 | {16x36x16} |
{36x36x36} | - | 40x20 | {16x40x16} |
{40x40x40} | - | - | - |
T max : temperaturas máximas; T min : temperaturas mínimas; trainlm: Algoritmo de entrenamiento Levenberg-Marquardt; trainbr: Algoritmo de entrenamiento de regularización Bayesiana; tansig: Función de transferencia tangente-sigmoidea; purelin: Función de transferencia de limite rígido.
Resultados y discusión
Entrenamiento, evaluación y validación (1 484 datos), para los 96 escenarios de la RNA
Se determinaron todos los escenarios (Tabla 1), los rangos de variación de los RMSE de estos, para la variable temperatura máxima fueron de: 1.2540 {e4} {20} a 2.4858 {e4} {40x20}; 2.1790 {e3} {40x40} a 2.2765 {e4} {8x12x4}; 2.3280 {e1} {40x40x40} a 2.4277 {e4} {16x40x16} y 2.5093 {e3} {40} a 2.6276 {e4} {16x32x16}, para las estaciones Santa Rosa I, Ruiz Cortínez, Batequis y Santa Rosa 2, respectivamente.
Para la temperatura mínima fueron de: 2.2372 {e1} {36x36} a 2.2554 {e4} {32x16}; 2.0152 {e3} {40x40} a 2.17 {e4} {16x40x16}; 2.1523 {e3} {36x36} a 2.2934 {e4} {8x8x4} y 2.01 {e3} {40x20} a 2.0809 {e4} {32x16}, para las estaciones Santa Rosa 1, Ruíz Cortínez, Batequis y Santa Rosa 2 en esa disposición.
Pronóstico (229 datos) con la RNA
Los rangos de los RMSE de todos los escenarios (Tabla 1), primero para la temperatura máxima, luego para la temperatura mínima, y para las estaciones: Santa Rosa 1, Ruiz Cortines, Batequis y Santa Rosa 2, en ese orden fueron de: 2.4448 {e4} {12x4} a 2.5522 {e1} {4x4x4}; 2.4697 {e3} {4x4} a 2.5420 {e2} {8x4}; 2.4915 {e1} {4} a 2.5246 {e1} {4x4x4}; 2.8649 {e1} {12} a 2.9574 {e1} {4x4}, y 2.0223 {e4} {16x32x16} a 2.1713 {e2} {36x20}; 1.9922 {e4} {16x32x16} a 2.09 {e4} {24x16}; 2.0346 {e4} {8} a 2.1776 {e2} {12x4}; 2.3035 {e1} {8} a 2.3865 {e3} {32x16}.
De todos los escenarios presentados para el entrenamiento y el pronóstico de las temperaturas máximas y mínimas diarias son mejores estimadores los escenarios {e3} para el primero, {e4} y {e1} para el segundo, para estos se aplica en la capa de salida la función de límite rígido (purelin), a excepción de {e1}, y en las capas intermedias la función tansig. Şahin (2012) realizó estimaciones de temperaturas medias mensuales del aire con sensores remotos y redes neuronales artificiales y obtuvo RMSE de 1.254 y 1.263 K en sus mejores ajustes y utilizó las mismas funciones de transferencia, en la salida y en la capa oculta. La mayoría de los RMSE en el presente estudio no son menores de 2°C, ya que se utilizaron valores de temperatura diaria.
Las diferencias de los RMSE de todos los rangos de los escenarios presentados tanto para el entrenamiento como el pronóstico no son mayores a 0.16°C para ambas temperaturas (máxima y mínima) y en las cuatro estaciones (Tabla 2), por lo que se puede utilizar cualquier escenario. Es la excepción la temperatura máxima de la estación Santa Rosa 1 (1.2°C).
Estación | Entrenamiento (1484 datos) | Pronóstico (229 datos) | ||
---|---|---|---|---|
T max | T min | T max | T min | |
Santa Rosa 1 | 1.2318 | 0.0582 | 0.1074 | 0.149 |
Ruiz Cortines | 0.0975 | 0.1548 | 0.0723 | 0.0978 |
Batequis | 0.0997 | 0.1411 | 0.0331 | 0.143 |
Santa Rosa 2 | 0.1183 | 0.0709 | 0.0925 | 0.083 |
T max : temperaturas máximas; T min : temperaturas mínimas.
Los mejores escenarios de los entrenamientos no coinciden con los mejores escenarios de los pronósticos (Tabla 3). Además en la mayoría de los mejores entrenamientos, para ambas temperaturas, el mayor número de neuronas en las capas ocultas tienen un RMSE cercano a cero, pero no necesariamente los entrenamientos con el mayor número de capas ocultas serán siempre los que obtengan los mejores ajustes, solo uno de los escenarios con tres capas ocultas presentó uno de los mejores ajustes (estación Batequis). También se observa que a diferencia de los entrenamientos, en los pronósticos la mayoría de los mejores ajustes se presentan cuando el número de neuronas en las capas ocultas son las menores, esto corrobora lo que comentan Demuth & Beale (2001) y Tymvios, Michaelides & Skouteli. (2008), que uno de los problemas que ocurre cuando se está entrenando una RNA es que se sobreajusta el conjunto de entrenamiento y no generaliza bien para un nuevo conjunto de datos (pronóstico), como sucede en el presente trabajo.
Además (Tabla 3) no hay un escenario determinado que haya sido el mejor, tanto en el entrenamiento como en el pronóstico.
Lo que interesa son los mejores escenarios del pronóstico, ya que estos garantizan que los datos estimados estén más cercanos a los observados (RMSE cercanos a cero). Como los mejores escenarios del pronóstico no se corresponden con los mejores del entrenamiento, se tomó la decisión de trabajar con los del pronóstico que se presentan en las dos últimas columnas (Tabla 3).
Estación | Mejores escenarios con su error | |||
---|---|---|---|---|
Entrenamiento | Pronóstico | |||
T max | T min | T max | T min | |
Santa Rosa 1 | {e4}, {20}, 1.25 | {e1} {36x36}, 2.24 | {e4} {12x4}, 2.44 | {e4} {16x32x16}, 2.02 |
Ruiz Cortines | {e3} {4x40}, 2.18 | {e3} {40x40}, 2.02 | {e3} {4x4}, 2.47 | {e4} {16x32x16}, 1.99 |
Batequis | {e1} {40x40x40}, 2.33 | {e3} {36x36}, 2.15 | {e1} {4}, 2.49 | {e4} {8}, 2.05 |
Santa Rosa 2 | {e3} {40}, 2.51 | {e3} 40x20}, 2.01 | {e1} {12}, 2.87 | {e1} {8}, 2.30 |
T max : temperaturas máximas; T min : temperaturas mínimas
Comparación de los mejores escenarios del pronóstico de RNA con los modelos de series de Fourier de mejor ajuste
Los mejores escenarios del pronóstico de las RNA se compararon con los mejores modelos de series de Fourier obtenidos para cada una de las estaciones, en la Figura 1 (Santa Rosa I) se muestra el comportamiento de las diferencias de los valores observados de temperatura máxima con los valores pronosticados con cada uno de estos dos modelos. Estas diferencias presentan las mismas tendencias y están alejadas de la línea del valor cero en la misma proporción. Además se observa que el rango de las diferencias está entre 10° C y -6° C. Esto que se comentó se presenta también en las otras tres estaciones y para la temperatura mínima (Figura 2).
En la estimación de las variables temperatura máxima y mínima, los mejores modelos de series de Fourier solo para dos estaciones, están descritos debajo de las Figuras 1 y 2. Los RMSE obtenidos, para el ajuste (1484) y la validación (pronóstico) del modelo (229), para la temperatura máxima fueron: Santa Rosa 1, con n=5, 2.553, 2.6213; Ruiz Cortines, con n =7, 2.266, 2.5321; Batequis, con n=7, 2.417, 2.6847 y Santa Rosa 2, con n =7, 2.555, 3.0855. Y para la temperatura mínima: Santa Rosa 1, n = 7, 2.379, 2.1415; Ruiz Cortines, n = 8, 2.163, 2.1759; Batequis, n = 8, 2.289, 2.1822 y Santa Rosa 2, n = 7, 2.135, 2.5005.
Al comparar los RMSE (Tabla 3) de las RNA con los del modelo de series de Fourier para temperatura máxima en las cuatro estaciones para el pronóstico, los primeros resultan mejores, por centésimas, lo mismo sucede al comparar los RMSE para la temperatura mínima. Al tener en cuenta que las temperaturas se registran hasta decimas de grado, las RNA presentan un mejor desempeño (menores RMSE) en máximo tres décimas, que el modelo de Fourier para todas las estaciones. No obstante que para entrenar este tipo de red neuronal (backpropagation) se necesitan conocer cuatro variables de entrada (día juliano, latitud, longitud y altitud) y para el modelo de series de Fourier únicamente la serie de tiempo en días.
Lo obtenido en este trabajo corrobora lo encontrado por Şahin (2012), que propone a la red neuronal artificial como un método alternativo para estimar la temperatura del aire con suficiente exactitud. La importancia de los modelos de series de Fourier obtenidos es como lo comentan Coronas & Baldasano (1984), que las ecuaciones son representativas de forma anual para donde se generaron y su ventaja, es que representan una gran cantidad de datos en una sola ecuación y se incorporan nuevos datos fácilmente. Finalmente, Almonacid, Pérez-Higueras, Rodrigo & Hontoria (2013) también realizaron una comparación de tres métodos para estimar temperaturas horarias para localidades españolas: el de redes neuronales artificiales proporcionó los mejores resultados, la función de transferencia que utilizaron fue purelin en la capa de salida y tangente sigmoidea en la capa oculta, obteniendo RMSE en un rango de 0.53 - 1.20° C, estas funciones fueron las que mejor desempeño obtuvieron en el presente trabajo tanto en los ajustes, como en los pronósticos.
Conclusiones
En el pronóstico de las temperaturas máximas o mínimas en el distrito de riego 075 para cualquiera de sus aplicaciones, como el cálculo de la evapotranspiración de referencia, se pueden utilizar cualquiera de los escenarios de las RNA. Las funciones de transferencia que ofrecen mejores desempeños en el ajuste para el entrenamiento y/o pronóstico de la temperatura máxima o mínima diaria con la RNA backpropagation fueron: tangente sigmoidea en la capa oculta y purelin en la capa de salida. Los mejores modelos de RNA para el pronóstico de temperaturas máximas y mínimas diarias obtuvieron desempeños similares en comparación con los realizados por los mejores modelos de series de Fourier, para las estaciones de estudio.