Introducción
Las inundaciones son fenómenos naturales que se producen cuando las lluvias se presentan de manera frecuente o son tan fuertes que la capacidad de absorción del suelo es sobrepasada, generando que el agua cambie de curso y se extienda hacia las zonas adyacentes al mismo (SDAB, 2009). Cuando estos fenómenos ocurren en entornos urbanos que se encuentran poblados, las consecuencias se hacen más notorias, pues no sólo se presentan daños en el nivel ambiental, sino también en los ámbitos social y económico, pues las entidades gubernamentales se ven en la necesidad de desviar grandes recursos asignados originalmente a otros sectores de desarrollo, como la educación, salud y otros, para recuperar los espacios inundados e infraestructura (CAR, 2016). Al respecto, datos del Banco Mundial Colombia (2012) muestran que las inundaciones ocasionan 43% de las viviendas destruidas y alrededor de 10% de pérdidas de vidas humanas. Por otra parte, dos de los eventos con gran variabilidad climática que representan mayor amenaza en Colombia son los Fenómenos de “El Niño” y “La Niña”. El primero se caracteriza por la presencia de sequías y escasez de agua, produciendo incendios forestales. Por otro lado, el fenómeno de “La Niña” presenta una mayor saturación de humedad de los suelos, lo que acarrea eventos como deslizamientos e inundaciones repentinas en los sistemas hídricos, que para el caso de Colombia se dan sobre todo en la región Andina, Caribe y Pacífica. Para enero de 2011 fue necesario declarar estado de emergencia económica, social y ecológica en todo el territorio colombiano debido a los devastadores efectos generados por las inundaciones. La Corporación Autónoma Regional (CAR), que administra la cuenca del río Bogotá, sostiene que es necesario contar con modelos probabilísticos que estimen la variabilidad climática e identifiquen el aumento del volumen de los ríos, considerando que a través de ellos se puedan crear alertas de desastres naturales y obtener información útil al momento de la toma de decisiones con respecto a la prevención de emergencias (CAR, 2016).
Sobre este aspecto, tradicionalmente la hidrología recurre a métodos unidimensionales de pronóstico de caudales con los cuales se determinan las inundaciones mediante regresiones lineales (Pandey & Nguyen, 1999), que miden la relación entre las variables dependientes e independientes del fenómeno (Weisberg, 2005). El inconveniente han sido los problemas y limitaciones que han tenido en el área de la predicción, no sólo por el cambio climático que se está dando en la tierra (Huffman, 2001), o la dificultad de calibración y las herramientas de optimización robustas que se necesitan (Kia et al., 2011), sino porque este tipo de fenómenos son no lineales, lo que hace inapropiado el uso de este tipo de modelos predictivos (Dawson, Abrahart, Shamseldin, & Wilby, 2006; Aqil, Kita, Yano, & Nishiyama, 2007). Como se expuso antes, si bien los métodos tradicionales han sido de gran ayuda a la hora de pronosticar inundaciones, los investigadores se han dado a la tarea de estudiar nuevos modelos más eficientes, que tengan mayor exactitud en el pronóstico.
Otra forma en la que se hace pronóstico de inundaciones es empleando los modelos físicos basados en principios hidráulicos, que permiten explicar a través de leyes físicas unidas con ecuaciones diferenciales el comportamiento de los cauces de los ríos. Algunas de las ecuaciones estudiadas son las de Saint-Venant, que han sido útiles en modelos de tránsito; sin embargo, se ha evidenciado que cuando la lámina de flujo crece rápidamente, en algunas ocasiones genera soluciones inestables debido a la alta acumulación de errores, por lo que se requiere de una matemática de mayor complejidad y una modelación más precisa (Amarís, Guerrero, & Sanchez, 2015).
Otro problema de los modelos físicos es la cantidad de información que requieren, en términos de variables hidrometeorológicas (caudal, nivel de agua y precipitación, entre otras), además de las consideraciones de los aspectos geológicos y topográficos del cauce, como batimetría del terreno, tipos de suelos, curvas de gasto y parámetros de escurrimiento (Merwade, Cook, & Coonrod, 2008; Kia et al., 2011). Lo anterior limita la aplicación de este tipo de modelos, dado que ciertas cuencas no han sido caracterizadas en términos de la capacidad de almacenamiento, captación de agua y probables zonas de inundación alrededor del río (Werner, Gallagher, & Weeks, 2006; Park, Joo, & Kim, 2012; Callow & Boggs, 2013).
El modelo físico analizado en esta investigación es el llamado modelo de tránsito de caudales, el cual predice el cambio de magnitud, velocidad y forma de una onda de flujo en función del tiempo (hidrograma), en uno o más puntos a lo largo de un cauce o canal de agua (Chow, Maidment, & Mays, 1994). Esta modelación unidimensional fue realizada empleando el software HEC-RAS, creado por el ejército de los Estados Unidos (US Army Corps Engineers & Hydrologic Engineering Center, 2016), el cual ha sido utilizado en diversos trabajos para simulación hidráulica (Manfreda et al., 2014; Guida, Swanson, Remo & Kiss, 2015; Dimitriadis et al., 2016).
Además, el software HEC-RAS ha sido empleado para analizar el riesgo de inundaciones, a través de sistemas de simulación hidráulica en 3D, 2D y 1D (Zazo, Molina, & Rodríguez-González, 2015).
Por otro lado, en la actualidad se han desarrollado estudios de modelos de predicción para eventos futuros integrando técnicas de sistemas de inteligencia artificial, la cual tiene una estructura matemática flexible, que es capaz de modelar relaciones complejas no lineales entre las características de los datos de entrada y de salida, para lo cual es difícil describir el proceso utilizando ecuaciones físicas (Seckin, Cobaner, Yurtal, & Haktanir, 2013). Algunas de las técnicas más usadas en el campo de la inteligencia artificial para el pronóstico de inundaciones a nivel global son las redes neuronales artificiales (RNA), que a través de modelos matemáticos inspirados en procesos neurológicos simulan el funcionamiento del cerebro para la resolución de problemas (Kalteh, 2013; Wang, Chau, Cheng, & Qiu, 2009). Otra técnica es la unión entre las redes neuronales y los sistemas difusos (ANFIS, por sus siglas en inglés), la cual es utilizada para la elaboración de modelos de pronóstico (Aqil et al., 2007). Algunos de los casos de aplicación de las RNA como sistemas de predicción se muestran en la Tabla 1.
Autor | Aplicación |
---|---|
Kalteh (2013) | Desarrolla modelos de predicción implementando técnicas de inteligencia artificial |
Nastos, Paliatsos, Koukouletsos, Larissi, & Moustris (2014) | Pronostican la precipitación máxima diaria |
Tisseuil, Vrac, Lek, & Wade (2010) | Evalúan modelos estadísticos distintos, entre los cuales están las redes neuronales RNA, para predecir el cambio climático, considerando recursos hidrológicos |
Yilmaz, Imteaz, & Jenkins (2011) | Predicen los flujos de captación de nieve, evaluando datos de escorrentía basados en antecedentes meteorológicos |
Fantin-Cruz et al. (2011) | Realizan una construcción histórica de zonas de inundación en Brasil usando redes neuronales |
Taormina, Chau, & Sivakumar (2015) | Realizan el pronóstico fluvial de un río a través de la separación del caudal base y la optimización del código binario |
Deo & Şahin (2016) | Realizan un modelo predictivo de caudal en Queensland, simulando el nivel medio del caudal en una máquina de aprendizaje extremo (ELM), comparando el rendimiento con RN |
Appelhans, Mwangomo, Hardy, Hemp, & Nauss (2015) | Predicen los patrones de temperatura en el monte Kilimanjaro con 14 algoritmos de aprendizaje |
Deo & Şahin (2015) | Pronostican la precipitación estandarizada mensual y el índice de evapotranspiración |
En la actualidad, las técnicas de inteligencia artificial se están tomando como referente para realizar investigaciones de predicción de eventos futuros debido a que emulan el comportamiento no lineal del fenómeno para dar un pronóstico más acertado (Zou, Xia, Yang, & Wang, 2007); en particular, en el campo de la hidrología, las técnicas de inteligencia artificial ayudan en la toma de decisiones adecuadas frente al uso del agua.
Este artículo presenta la comparación entre un modelo físico y un modelo inteligente para la predicción de niveles de inundaciones en un tramo de la cuenca del río Bogotá (Colombia), comprendido entre las estaciones hidrológicas de Puente Florencia y Tocancipá.
Materiales y métodos
Modelo hidrológico en HEC-RAS
Esta herramienta permite hacer modelaciones hidráulicas del comportamiento del flujo permanente y no permanente de agua en un canal artificial o en un cauce natural, como ríos (US Army Corps Engineers, HEC-RAS, 2006). La simulación hidráulica en este software se basa en ecuaciones diferenciales determinísticas, que permiten pronosticar la dinámica de los niveles de agua en los eventos con precipitaciones altas que generan inundación, definiendo las cotas de inundación a través de perfiles transversales, simulando de manera aproximada el comportamiento de la dinámica del recurso hídrico y del cauce con características de sesiones transversales con cualquier geometría a lo largo del cauce; distintas profundidades del agua y caudal variable a lo largo del cauce, en condiciones de régimen de flujo subcrítico o supercrítico, con efectos hidráulicos, debido a obstáculos transversales naturales o artificiales en el cauce (Sarhadi, Soltani, & Modarres, 2012; Mohammadi, Nazariha, & Mehrdadi, 2014).
En cuanto a la simulación del modelo implementado en esta investigación, el software HEC-RAS utiliza la ecuación de continuidad (US Army Corps Engineers & Hydrologic Engineering Center, 2006), que describe la conservación de la masa para un sistema unidimensional, además de calcular términos de almacenamiento:
Donde x = distancia a lo largo del cauce; t = tiempo; Q = caudal; A = área de la sección transversal; S = almacenamiento, y q 1 = entrada lateral por unidad de distancia.
Además, para desarrollar la modelación se utilizaron los siguientes parámetros de calibración:
Hidrogramas: gráficas que permiten observar la tasa de flujo o caudal en un lugar dado de la corriente (Chow et al., 1994).
Curvas de gasto o de calibración: representaciones gráficas de la relación existente entre el nivel de agua y su respectivo caudal (Salazar & Chaparron, 1990).
Secciones transversales: definen la forma del río, sus características geométricas y deben estar conectadas topográficamente de modo que definen el perfil longitudinal:
donde K = sección transversal; n = coeficiente de rugosidad de Manning para la sección; A = área de caudal de la sección, y R = radio hidráulico de la sección (área/ perímetro húmedo).
Coeficiente de Manning: llamado también coeficiente de rugosidad, permite estimar la resistencia al escurrimiento que posee un canal (Ruberto, Carreras, & Depettris, 2003). Cuando se tienen varios coeficientes de Manning (nc) en un cauce, el canal principal es dividido en N partes, cada uno con el perímetro de humedad Pi y el coeficiente de rugosidad n i .
donde n c = coeficiente de rugosidad compuesto; P = perímetro de humedad del canal principal; P i = perímetro de humedad de la sección I, y n i = coeficiente de rugosidad por sección.
Por lo general, investigaciones realizadas con este software evalúan el desempeño del modelo hidráulico en la predicción de inundaciones para identificar las zonas vulnerables, infraestructura crítica y el valor del uso del suelo afectado (Sarhadi et al., 2012; Zazo et al., 2015). Estudios han demostrado que la modelación en HEC-RAS permite evaluar diferentes escenarios para el pronóstico de áreas de inundación (Guida et al., 2015). Además, este software se usa para optimizar las características geométricas de la visualización real de las zonas propensas a inundaciones, las cuales puede ser observada después a través de un Sistema de Información Geográfica (GIS, por sus siglas en inglés) (Sarhadi et al., 2012). Un caso de estudio es el mostrado por Mohammadi et al. (2014), quienes simularon condiciones hidráulicas de inundación y áreas inundables para diferentes periodos de retorno, utilizando modelos en HEC-RAS, HEC-GEORAS y GIS, obteniendo como resultados un análisis de riesgos y daños de las inundaciones.
Modelo de redes neuronales artificiales
La estructura estándar de una RNA (Figura 1) está compuesta por un conjunto de neuronas organizadas en capas (de entrada, ocultas y de salida), distribuidas de forma jerárquica, constituyendo un sistema funcional autónomo (Chen, Chen, Chou, & Yang, 2010). En este sistema inteligente se identifican los siguientes elementos: variables de entrada y de salida; pesos sinápticos, que son la intensidad de interacción entre las neuronas; función de propagación; función de activación, y función de salida (Komatsu et al., 2014). El número de capas y de neuronas es uno de los parámetros más importantes en la modelación de RNA, pues determina la eficiencia del sistema.
Una de las ventajas de las RNA es que son una herramienta útil para el modelado, cuando la relación entre los datos de entrada y de salida no es conocida, razón por la cual este tipo de modelos son llamados de caja negra (Chau, Wu, & Li, 2005; Wang, Wang, Lei, Jiang, & Song, 2011); esto permite que a través de sus composiciones matemáticas sean capaces de modelar sistemas complejos, como pueden ser los procesos hidrológicos (Dawson et al., 2006). Otro de los beneficios derivados de las RNA es su capacidad de generar salidas de una combinación específica de entradas y su capacidad de respuesta frente al manejo de datos no lineales (Santillán, Fraile-Ardanuy, & Toledo, 2014; Cervantes-Osornio, Arteaga-Ramírez, Vázquez-Peña, Ojeda-Bustamante, & Quevedo-Nolasco, 2013).
Datos disponibles
La cuenca del río Bogotá se localiza en el departamento de Cundinamarca, Colombia. Tiene una superficie total de 5 891 km2, que corresponde a un 32% del total de la superficie departamental. El río Bogotá constituye la corriente principal de la cuenca, recorriendo desde su nacimiento a los 3 300 metros sobre el nivel del mar (msnm) el municipio de Villapinzón hasta su desembocadura al río Magdalena, a los 280 msnm en el municipio de Girardot, un total de 308 km (CAR, 2006).
El río Bogotá está dividió en tres subcuencas: alta, media y baja. El tramo de estudio está en la cuenca alta (Figura 2), entre las estaciones hidrológicas de Puente Florencia, en el municipio de Gachancipá (Aguas Arriba), y la estación Tocancipá, en el municipio con el mismo nombre (Aguas Abajo). Este tramo se caracteriza por: a) ofrecer registro de frecuencia horaria de caudal; y b) estabilidad en el registro, es decir, no existe ningún embalse u otro cuerpo hídrico de gran tamaño que altere de forma significativa el comportamiento hídrico de la cuenca.
De manera adicional, se identificaron 12 subcuencas pequeñas que aportan caudales al tramo estudiado que, sumados, aumentan de forma considerable el nivel del río en épocas de alta precipitación. Para el cálculo del aporte del caudal de cada subcuenca se utilizó el método racional basado en los parámetros de forma y red de drenaje, empleando las curvas de nivel que le dan forma a cada subcuenca y el orden del afluente (Horton, 1945).
Modelación física empleando el software HEC-RAS
Para el modelo físico implementado en HEC-RAS fue necesario establecer los parámetros de calibración, con los cuales se simularon los caudales a la salida del modelo. Los parámetros son los siguientes: hidrogramas de las estaciones Puente Florencia y Tocancipá, curvas de gasto o de calibración, secciones transversales y coeficiente de Manning.
Para el modelo de tránsito de caudales se realizó una simulación con los datos de abril, mayo, octubre y noviembre, debido a que en estas fechas ocurrieron inundaciones por la alta precipitación; se tomó la decisión de simular los meses mencionados para los años 2011 y 2013.
En cuanto a las curvas de gasto, para el caso de la estación de Puente Florencia, los valores máximos de caudal cercanos a los 60 m3/s se pueden dar a una altura de nivel de agua de 5 m; en la Estación Hidrológica de Tocancipá, los valores máximos de caudal están cercanos a los 50 m3/s y se pueden presentar a una altura de nivel de agua de cinco metros.
En cuanto a las secciones transversales del modelo, se suministraron los puntos de medición obtenidos por medio de batimetría en el terreno. Se ingresaron 151 secciones en el tramo elegido, con una distancia que varía entre los 100 y 800 m de longitud, dependiendo de la forma del cauce; es decir, en zonas con curvas muy cerradas, se hizo la medición a distancias más cortas.
Por otro lado, el coeficiente de Manning fue calibrado según la superficie de rozamiento constante del agua y la superficie de menos rozamiento en las zonas laterales del cauce.
Para la calibración del modelo hidráulico unidimensional simulado en HEC-RAS, se comenzó mediante la identificación de un hidrograma simple, en el que se viera una onda sin distorsiones, en un periodo donde se presentan caudales medios en el tramo estudiado, empleando coeficientes de Manning en un rango de 0.021 a 0.04 en todas las secciones transversales (Santos, Cubillos, & Vargas, 2008; Cook & Merwade, 2009). Teniendo en cuenta las características anteriormente descritas, se eligió el periodo del 12 al 23 de julio del año 2010, donde se ingresaron los hidrogramas de la estación de Puente Florencia y el caudal de las 12 subcuencas calculadas.
Luego de la calibración del coeficiente de Manning se simularon tres escenarios (enero, abril-junio y octubre), para los años 2011 y 2013. Con respecto al parámetro ubicado en la última sección transversal, correspondiente a la Estación de Tocancipá, o salida del modelo, se configuró con profundidad normal (Normal Depth) de valor 0.0001, el cual es adecuado para situaciones donde el flujo se aproxime al uniforme (US Army Corps Engineers & Hydrologic Engineering Center, 2006).
Modelación en redes neuronales artificiales
Para la simulación con RNA se utilizó el toolbox del software Matlab 2013®, empleando los datos de los caudales de la estación de Puente Florencia y de las 12 subcuencas del tramo escogido como entrada, y los caudales de la estación de Tocancipá, como salida del modelo.
Antes los datos deben ser normalizados en un rango de -1 a 1 (Matworks, 2013), generando una matriz de entrada al modelo con los caudales de la estación de Puente Florencia y de las 12 subcuencas del tramo escogido. La salida del modelo es un vector con los datos calculados por la RNA de los caudales en la Estación de Tocancipá.
Para el entrenamiento de la RNA y su pronóstico con exactitud es necesario dividir los datos en dos partes. Unos de entrenamiento (70%): se emplearon los datos de los meses de septiembre de 2009 a diciembre de 2012, incluyendo los meses de febrero, marzo, julio, agosto y septiembre de 2013. Para el pronóstico se tomó el 30% restante con los datos de los meses de enero, abril, mayo, junio y octubre de los años 2011 y 2013.
La configuración del toolbox de Matlab® se estableció con una clase de entrenamiento tipo back propagation (Kia et al., 2011; Chen et al., 2010). Asimismo, la función de aprendizaje elegida fue Levenberg-Marquardt (trainlm), siendo más rápida cuando se utiliza este tipo de entrenamiento en redes de gran tamaño, realizando mejor la función de ajuste para el reconocimiento de patrones del sistema trabajado (Matworks, 2013). Además, se configuraron los siguientes parámetros en el toolbox para correr el modelo: un máximo de 2 000 iteraciones (repeticiones), gradiente mínimo de 1e-05 y un máximo de seis revisiones de validación para evaluar la calidad del modelo.
Por otro lado, para cada escenario entrenado se utilizó una estructura multicapa (Kia et al., 2011; Siou, Johannet, Borrell, & Pistre, 2011), modificando el número de capas (entre 2 y 20) y neuronas (entre 2 y 50). En total, se realizaron 168 escenarios, los cuales se dividieron según su función de propagación en las capas de entrada y ocultas, respectivamente: 85 con la configuración Sigmoidal-Sigmoidal, y 83 con la configuración Sigmoidal-Lineal. Para cada escenario se hizo la simulación del pronóstico y con los resultados obtenidos se hallaron cada uno de los estadísticos para observar la eficiencia del modelo mediante el desarrollo de un programa realizado en Matlab®.
Criterios de evaluación estadística de los modelos
Luego de las simulaciones que arrojaba el hidrograma de salida en la Estación de Tocancipá de cada uno de los periodos, se compararon con los datos reales presentados en los mismos lapsos. El análisis se hizo a través de seis índices estadísticos usados en la mayoría de artículos observados y utilizados como métricas de evaluación de modelos simulados (Dawson, Abrahart, & See, 2007): error medio absoluto (MAE, por su nombre en inglés) (Singhal & Swarup, 2011); error medio cuadrático (MSE, por su nombre en inglés) (Gomes & Ludermir, 2013); error porcentual absoluto de la media (MAPE, por su nombre en inglés) (Lewis, 1982); raíz cuadrada del error cuadrático medio (RMSE, por su nombre en inglés) (Singhal & Swarup, 2011); coeficiente de correlación de Pearson (CC, por su nombre en inglés) (Lin, Hedayat, Bikas, & Yang, 2002), y coeficiente de correlación de concordancia (ρc, por su nombre en inglés) (Lin, 2011).
Además de lo anterior, los resultados obtenidos en esta investigación se compararon con el test de hidrología “HydroTest Statistical Assessment of Hydrological Forecasts”, el cual evalúa 20 métricas estadísticas reportadas en estudios de modelamiento hidrológico (Dawson et al., 2007). Se evaluaron cuatro métricas de este test, donde se ingresaron los datos reales y los datos modelados (HEC-RAS, RNA Sig-Lin y RNA Sig-Sig), correspondientes a 30% de los datos seleccionados para validación.
Resultados
Los resultados del modelo simulado en HEC-RAS se encuentran en la Tabla 2, con los seis estadísticos, en los cuales se observa un ρc, con un valor de 0.86; esto indica que el modelo tiene una alta relación de los datos reales en contra de los datos simulados en cuanto a exactitud y precisión. El coeficiente de correlación (CC) indica que se presenta un error de la relación del dato simulado inferior al10%, es decir que el error es bajo. Los valores de MAE, MSE y RMSE son bajos, lo que indica diferencias pequeñas con respecto a los datos reales, ello se evidencia en un buen pronóstico, pues el valor del MAPE se encuentra entre 11 y 20% (Lewis, 1982).
Luego de la simulación del modelo con RNA y la organización de los datos simulados con respecto a los estadísticos evaluados, se eligieron los tres escenarios con mayores valores totales de los criterios estadísticos MAE, MAPE, MSE, RMSE, CC y ρc para cada una de las configuraciones de la red. En la Tabla 3 se recopilan los mejores tres escenarios obtenidos en el modelo de RNA de cada configuración.
Función | Aceptación | Mayor coeficiente | Mayor coeficiente | Menor error | MAPE < 20 % | Menor error | Menor error |
---|---|---|---|---|---|---|---|
Criterio | ρc | CC | MAE | MAPE | MSE | RMSE | |
Sigmoidal-Sigmoidal | Escenario 3 | 0.8639 | 0.9032 | 2.0652 | 13.4254 | 12.2868 | 3.5052 |
Escenario 4 | 0.8667 | 0.9035 | 2.0604 | 13.4697 | 12.2299 | 3.4971 | |
Escenario 9 | 0.8770 | 0.9215 | 1.9007 | 11.9590 | 10.1782 | 3.1903 | |
Sigmoidal-Lineal | Escenario 2 | 0.8729 | 0.9136 | 1.9462 | 12.5194 | 10.9753 | 3.3129 |
Escenario 3 | 0.8593 | 0.9108 | 2.0435 | 12.6997 | 11.6512 | 3.4134 | |
Escenario 6 | 0.8731 | 0.9104 | 1.9834 | 13.0086 | 11.3318 | 3.3663 |
Discusión
Luego de analizar todos los criterios estadísticos de los mejores escenarios elegidos, el mejor escenario de función de propagación Sigmoidal-Sigmoidal es el número 9, el cual estaba compuesto por 20 capas con 25 neuronas cada una, debido a que cumple con la mayor cantidad de resultados favorables en los estadísticos: menor MAE (1.90), menor MAPE (11.9%), menor MSE (10.2), menor RMSE (3.2), mayor CC (0.92) y mayor ρc (0.88). Tomando como referencia el resultado obtenido con el MAPE, se observa que el pronóstico arrojado es bueno, pues se encuentra entre un rango entre 11 y 20% (Lewis, 1982), y el CC indica que el modelo presenta un 92% de precisión del pronóstico en cuanto a la relación de los datos reales con los simulados.
Sobre la función de propagación Sigmoidal-Lineal, se eligió el escenario 2 como el de mejor pronóstico, el cual estaba compuesto por dos capas con 50 neuronas cada una, porque cumple con la mayor cantidad de resultados favorables en los criterios estadísticos evaluados: menor MAE (1.94), menor MAPE (12.5%), menor MSE (10.97), menor RMSE (3.1) y mayor CC (0.914).
Con respecto al número de neuronas, las dos configuraciones arrojaron el mejor pronóstico, con una cantidad considerable de ellas en cada capa.
Comparación del modelo físico y los modelos de inteligencia artificial
Se encontraron investigaciones que comparan modelos matemáticos, como las regresiones lineales o la regresión múltiple, con sistemas artificiales inteligentes, las cuales concluyen que los sistemas inteligentes poseen un mayor grado de relación entre el dato real contra el dato simulado (Aqil et al., 2007; Firat & Güngör, 2007; Kisi, Shiri, & Nikoofar, 2012; Karimi, Kisi, Shiri, & Makarynskyy, 2013), proporcionando un mejor pronóstico que los modelos matemáticos. Sin embargo, en la bibliografía consultada no se evidencian estudios que realicen una comparación con un modelo físico, basado en hidráulica o hidrología tradicional, razón por la cual se realizó esta comparación. De igual manera, se encontró que se utilizan los criterios estadísticos tradicionales (CC, MAE, MAPE, RSME), pero ninguno con un análisis a través del coeficiente de correlación de concordancia (ρc), el cual indica la relación entre precisión y exactitud del modelo (Firat & Gürgör, 2007).
A partir de los resultados obtenidos se comparó el modelo físico simulado en el software HEC-RAS con los dos mejores modelos de RNA simulados en Matlab®. En la Tabla 4 se muestran los resultados de los tres mejores modelos. Los datos obtenidos sugieren que los modelos indican resultados de pronósticos muy similares, mostrando en orden de efectividad primero el RNA sigmoidal-sigmoidal, segundo el RNA sigmoidal-lineal y por último el modelo HEC-RAS.
Aceptación | Mayor coeficiente | Mayor coeficiente | Menor error | MAPE < 20 % | Menor error | Menor error |
---|---|---|---|---|---|---|
Modelo | ρc | CC | MAE | MAPE | MSE | RMSE |
HEC-RAS | 0.8601 | 0.9077 | 2.2311 | 11.9535 | 15.7725 | 3.9715 |
RNA Sig-Sig | 0.877 | 0.9215 | 1.9007 | 11.959 | 10.1782 | 3.1903 |
RNA Sig-Lin | 0.8729 | 0.9136 | 1.9462 | 12.5194 | 10.9753 | 3.3129 |
En la Figura 3 se comparan los tres mejores modelos utilizados en la investigación (HEC-RAS, RNA sigmoidal-sigmoidal y RNA sigmoidal-lineal) y la relación de los datos reales con los simulados a través de una línea de referencia. Cabe aclarar que para esta simulación se emplea 30% de los datos totales de caudal para validar los modelos.
En la Figura 3 se observa que existen datos de caudal de salida en la estación de Tocancipá reales contra los simulados, que están por encima y debajo de la línea de referencia; si los datos están por encima, el pronóstico del caudal sería sobrestimado; si los datos están por debajo, el pronóstico del caudal sería subestimado.
Observando las gráficas se aprecia que el modelo de la Figura 3a con HEC-RAS subestima los caudales de salida, pues la mayoría de los datos se encuentra debajo de la línea de referencia; esto significa que podría no lograr predecir niveles de inundación. Por el contrario, los datos pronosticados por las RNA (figuras 3b y 3c) tienen una dispersión de datos más homogénea, apreciando datos por encima y debajo de la línea de referencia, lo cual indica que tendrían una mayor posibilidad de predecir niveles de inundación para caudales altos a la salida del modelo.
Observando la Tabla 4 se puede identificar que el mejor de los modelos de RNA es el de configuración sigmoidal-sigmoidal por los resultados en los estadísticos hallados. Luego de seleccionar el mejor de los modelos inteligentes se procedió a realizar los hidrogramas, comparando los datos de caudal reales con los simulados, para un periodo de altas precipitaciones, como abril de 2011.
Al analizar el hidrograma de la Figura 4a del modelo en HEC-RAS se observa que los valores simulados están por debajo de los reales, lo cual significa que el modelo físico no predice de modo adecuado caudales reales que se habían presentado en ese periodo; por tanto, el modelo no sería fiable para predecir eventos de inundación futuros.
Por otro lado, observando la Figura 4b, el modelo de RNA seleccionado logra predecir de mejor forma los caudales reales en el mismo periodo de la figura anterior, sin embargo fluctúa alrededor de los datos reales, lo que se evidencia en la gráfica de dispersión de la figura 3b.
Validación del modelo
En la Tabla 5 se muestra los valores comparados de las estadísticas calculadas en Matlab® contra las calculadas por el Hydrotest; además, se incluyen tres criterios estadísticos adicionales: coeficiente de determinación (RSQR, por su nombre en inglés) (Pearson, 1896); índice de acuerdo con Willmott (IoAd, por su nombre en inglés), y coeficiente de eficiencia (CE) (Ablan, Márquez, Rivas, Molina, & Querales, 2011).
Modelo | CC | MAE | RMSE | RSQR | IoAd | CE | |||
---|---|---|---|---|---|---|---|---|---|
Herramienta | Matlab | H. test | Matlab | H. test | Matlab | H. test | H. test | H. test | H. test |
HEC-RAS | 0.9077 | 0.9076 | 2.2311 | 2.1585 | 3.9715 | 3.7777 | 0.8237 | 0.9309 | 0.7837 |
RNA Sig-Sig | 0.9215 | 0.9204 | 1.9007 | 1.8938 | 3.1903 | 3.2106 | 0.8472 | 0.9557 | 0.8437 |
Al comparar los valores de los estadísticos CC, MAE y RMSE, se observa que son muy cercanos, variando en décimas o centésimas, indicando que fueron hallados de forma correcta en los análisis realizados en esta investigación. El RSQR de los resultados se encuentra en un intervalo de 0.801 a 0.847; ello muestra que son modelos satisfactorios, pues está cercano a 1.0 (Pearson, 1896), aunque cabe anotar que el modelo RNA de configuración sigmoidal-sigmoidal está muy cerca de ser un buen modelo de pronóstico. Desde el índice de acuerdo con Willmott (IoAd), los resultados de los dos mejores modelos simulados son buenos al tener valores superiores a 0.9 y, en general, muy similares en un intervalo de 0.93 a 0.95. El coeficiente de eficiencia (CE) sí muestra una gran diferencia entre los dos modelos de predicción realizados, rechazando el modelo físico de HEC-RAS (0.7837) con un valor inferior a 0.8. Para los otros dos modelos con sistemas inteligentes artificiales, se describen como satisfactorios, con valores que se encuentran en el intervalo de 0.80 a 0.84, siendo este último el valor del modelo RNA sigmoidal-sigmoidal (Dawson et al., 2007).
Conclusiones
Luego de observar los comportamientos de los dos modelos realizados se determinó que el modelo físico subestima los valores altos de caudal pronosticados, mientras que los modelos de RNA logran aproximarse más a los valores reales. Sin embargo, al revisar las gráficas de dispersión, se observa que la variación es mayor en las RNA que en el modelo de HEC-RAS, aunque esta dispersión en los modelos inteligentes está mucho más centrada hacia la línea de referencia, lo que se logra identificar en los hidrogramas, donde a pesar de que los caudales simulados llevan a valores cercanos a los reales hay variación.
Con respecto a los estadísticos encontrados en los modelos, se observa que tienen buenos resultados, que demuestran pronósticos muy cercanos a los datos reales y efectividad de las técnicas (MAPE, entre 11.95 y 12.51, que indica un buen pronóstico; CC, entre 0.90 y 0.92, lo que muestra una buena relación entre los datos reales y los simulados; CCC, entre 0.84 y 0.87, que demuestra precisión y exactitud en el pronóstico, y RSqr, IoAd y CE mayores a 0.8, lo que revela un pronóstico satisfactorio). Estos resultados se muestran como buenos, debido a que en los caudales medios y bajos la dispersión es baja en los dos modelos, y es donde se encuentra la mayor cantidad de los datos tomados para la presente investigación.