SciELO - Scientific Electronic Library Online

 
vol.23 número3Circuito de acondicionamiento con amplio rango dinámico para sensores resistivos basado en PSoCImportancia de tener en cuenta la masa térmica en simulaciones para una casa sin aire acondicionado índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay artículos similaresSimilares en SciELO

Compartir


Ingeniería, investigación y tecnología

versión On-line ISSN 2594-0732versión impresa ISSN 1405-7743

Ing. invest. y tecnol. vol.23 no.3 Ciudad de México jul./sep. 2022  Epub 07-Nov-2022

https://doi.org/10.22201/fi.25940732e.2022.23.3.023 

Artículos

Aplicación práctica de las funciones Cópula en el Análisis de Frecuencias Bivariado (Q,V) de Crecientes Anuales

Practical application of Copula functions in Bivariate Frequencies Analysis (Q,V) of Annual Floods

Daniel Francisco Campos-Aranda1 
http://orcid.org/0000-0002-9876-3967

1 Profesor Jubilado de la UASLP, Correo: campos_aranda@hotmail.com


Resumen:

El estudio por seguridad hidrológica de los embalses requiere la estimación del hidrograma de su creciente de diseño. La manera más simple y aproximada para definir tal gráfica, es a través del análisis de frecuencias bivariado (AFB) para obtener el gasto máximo (Q) y el volumen (V), asociados a un cierto periodo de retorno conjunto de diseño. Las funciones Cópula modelan la dependencia entre Q y V, a la vez que permiten construir la distribución bivariada con base en las distribuciones univariadas marginales previamente adoptadas. El uso de las funciones Cópula implica dos ventajas, separan el efecto de la dependencia entre Q y V, de las influencias de las distribuciones marginales y son de aplicación simple. Se realizó el AFB de los 52 datos de Q y V anuales de las crecientes de entrada a la Presa Venustiano Carranza (Don Martín), del estado de Coahuila, México; aplicando las funciones Cópula de Clayton, Frank, Gumbel-Hougaard y Plackett. El enfoque práctico adoptado utiliza funciones Cópula de un solo parámetro de ajuste y selecciona la más adecuada con base en los errores de ajuste entre probabilidades bivariadas. Debido a su importancia, la búsqueda de las funciones marginales se realizó con la distancia absoluta mínima, a las seis distribuciones que expone el diagrama de cocientes L. Se detalla el cálculo de la gráfica del periodo de retorno conjunto de tipo AND. Por último, se citan varias conclusiones que destacan las ventajas del uso de las funciones Cópula en los AFB de crecientes.

Descriptores: Funciones Cópula; cociente tau de Kendall; coeficiente rho de Spearman; error medio estándar; error absoluto medio; periodos de retorno conjuntos; eventos críticos

Abstract:

The hydrological safety study of reservoirs requires the estimation of the hydrograph of its design flood. The simplest and most approximate way to define such graph is through the bivariate frequency analysis (AFB acronym in Spanish) to obtain the maximum flow (Q) and the volume (V), associated with a certain joint design return period. Copula functions model the dependence between Q and V, at the same time, they allow the construction of the bivariate distribution based on the previously adopted marginal univariate distributions. The use of Copula functions implies two advantages, they separate the effect of the dependence between Q and V from the influence of the marginal distributions, and they are simple to apply. The AFB of the 52 annual Q and V data of the inflow floods to the Venustiano Carranza Dam (Don Martín), from the state of Coahuila, Mexico, was carried out; applying the Copula functions of Clayton, Frank, Gumbel-Hougaard and Plackett. The practical approach adopted uses Copula functions of a single fit parameter and selects the most appropriate one based on the fit errors between bivariate probabilities. Due to their importance, the search for the marginal functions was carried out with the minimum absolute distance, for the six distributions that the diagram of quotients L exposes. The calculation of the graph of the joint return period of type AND is detailed. Finally, conclusions highlight the advantages of using Copula functions in flood AFBs.

Keywords: Copula functions; Kendall's tau quotient; Spearman's rho coefficient; mean standard error; mean absolute error; joint return periods; critical events

Introducción

Generalidades

Los embalses son quizás la obra hidráulica más importante, ya sean de aprovechamiento o de control de crecientes. Su diseño hidrológico por seguridad, requiere estimar el hidrograma de su Creciente de Diseño, el cual muestra cómo evolucionó el gasto máximo durante tal evento y por ello, está definido por cuatro variables: el tiempo transcurrido hasta el gasto máximo (tp), el valor de este (Q), el volumen escurrido (V) y su duración total (D). Aldama (2000) demostró que los embalses no son sensibles al valor del tp y como el V y la D están correlacionados, el estudio multivariado de las crecientes se pudo reducir a un análisis bivariado de Q y V, para definir de manera aproximada el hidrograma de diseño.

Los análisis bivariados de las crecientes comenzaron a inicios de este siglo, con los trabajos de Yue (2000) y de Yue & Rasmussen (2002) y estuvieron limitados por la escasa disponibilidad de funciones de distribución de probabilidades (FDP) multivariadas, cuyos primeros modelos utilizados fueron extensiones de las distribuciones univariadas, por ejemplo, las bivariadas Normal, Log-normal, Exponencial, Pareto y Gamma. Favre et al. (2004) han destacado que este tipo de distribuciones tienen las siguientes tres desventajas: 1) sus distribuciones marginales pertenecen a la misma familia; 2) la extensión más allá del caso bivariado, no son simples o no existen y 3) los parámetros de ajuste de las distribuciones marginales también se usan para modelar la dependencia entre las variables aleatorias Q y V.

Las limitaciones que tienen las distribuciones bivariadas existentes, son fácilmente superadas usando las llamadas funciones Cópula (FC), las cuales permiten modelar la dependencia entre las variables Q y V, además de conjuntar las distribuciones marginales univariadas adoptadas previamente, para construir la nueva distribución bivariada (Shiau et al., 2006; Sraj et al., 2015; Genest & Chebana, 2017; Zhang & Singh, 2019).

Con el enfoque de aplicación práctica de las FC, se intenta una similitud operativa con los análisis de frecuencias de crecientes (AFC) bivariados, pero suprimiendo las desventajas citadas, al poder utilizar distribuciones marginales diferentes y de cualquier tipo; además, de tener enorme facilidad para construir la distribución bivariada con las FC. Lo anterior se logra utilizando FC que ya han sido probadas en los AFC, y no se aplica la simulación aleatoria para contraste de la FC que se prueba, sino que se selecciona con base en los indicadores de ajuste y su dependencia en el extremo derecho del ajuste.

Objetivos

Los objetivos de este estudio son los cuatro siguientes:

  1. Exponer de manera breve los conceptos operativos de las FC

  2. Enlistar las FC de cada familia que han sido utilizadas en los AFC

  3. Usar y probar las FC que son aplicables en el ejemplo numérico descrito y

  4. Estimar y contrastar los periodos de retorno univariados y los bivariados

La aplicación numérica se realiza para los 52 gastos máximos y volúmenes de las crecientes de entrada a la Presa Venustiano Carranza (Don Martín), del estado de Coahuila, México.

Teoría operativa

Las Funciones Cópula

Concepto y definición

La característica esencial de las Funciones Cópula (FC) consiste en permitir expresar una distribución conjunta de variables aleatorias correlacionadas, como una función de sus distribuciones marginales. Entonces, una FC enlaza o relaciona las distribuciones marginales univariadas para formar una distribución multivariada. Como en este estudio se aplicarán las FC en el análisis de frecuencias bivariado de las crecientes anuales, la definición siguiente se refiere a dos variables aleatorias X y Y correlacionadas, cuya función de distribución de probabilidades acumuladas conjuntas es F X,Y (x,y), con distribuciones marginales univariadas F X (x) y F Y (y); entonces la función Cópula C existe y es:

Fxyx,y=CFxx,Fyy (1)

La ecuación anterior define el concepto básico para el desarrollo de las FC y se conoce como Teorema de Sklar expuesto en 1959 (Shiau et al., 2006; Meylan et al., 2012; Genest & Chebana, 2017; Zhang & Singh, 2019; Chowdhary & Singh, 2019).

Familias de Cópulas

Son conjuntos de estas, en los cuales, las Cópulas que los integran se asemejan en cuanto a su forma. Las FC que han sido desarrolladas se han clasificado en cuatro clases (Meylan et al., 2012; Chowdhary & Singh, 2019): de Arquímedes, de valores extremos, elípticas y misceláneas. También se clasifican en Cópulas de un parámetro o de varios, dependiendo de la exhaustividad con la cual la estructura de la dependencia entre las variables está definida.

Las Cópulas de Arquímedes han tenido aplicación extensa debido a su construcción simple, un solo parámetro, rango amplio y aceptación de varios tipos de dependencia. Haciendo F X (x) = u, F Y (y) = v y θ el parámetro que mide la dependencia o asociación entre u y v, se tienen las siguientes tres Cópulas de Arquímedes, las cuales aceptan dependencia negativa y positiva (Salvadori et al., 2007; Chowdhary & Singh, 2019).

  • 1. Ali-Mikhail-Haq: Esta Cópula algunas veces se abrevia AMH y tiene un rango limitado para la dependencia, que se restringe a τ n variando de -0.1817 a 1/3:

Cu,v=uv1-θ1-u1-v  con-1θ1 (2)

La relación de θ con el cociente tau de Kendall es la siguiente:

τn=1-2θ+1-θ2ln1-θ3θ2 (3)

  • 2. Frank:

Cu,v=-1θln1+e-θu-1e-θv-1e-θ-1  con θ0 (4)

La relación de θ con el τ n es la siguiente:

τn=1+4θD1θ-1 (5)

Siendo, D1(θ) la función Debye de orden 1, cuya expresión es:

D1θ=1θ0θtet-1dt (6)

La ecuación anterior se evaluó con integración numérica, ratificando sus resultados con los valores tabulados por Stegun (1972).

Cu,v=u-θ+v-θ-1-1/θ  con θ0 (7)

La relación de θ con el cociente tau de Kendall es la siguiente:

τn=θθ+2 (8)

En seguida, se cita una Cópula de valores extremos, la cual acepta solo dependencia positiva.

  • 4. Gumbel-Hougaard:

Cu,v=exp--lnuθ+-lnvθ1/θ  con θ1 (9)

La relación de θ con el cociente tau de Kendall es la siguiente:

τn=θ-1θ (10)

Por último, se citan dos Cópulas de clase miscelánea, las cuales aceptan dependencia positiva y negativa, pero la primera tiene un rango bastante limitado.

  • 5. Farlie-Gumbel-Morgenstern: Esta Cópula algunas veces se abrevia FGM, tiene un rango limitado para la dependencia, que se restringe a τ n variando de -2/9 a 2/9:

Cu,v=uv+θuv1-u1-v  con-1θ1 (11)

La relación de θ con el cociente tau de Kendall y con la rho de Spearman son las siguientes:

τn=2θ9 (12)

ρn=θ3 (13)

  • 6. Plackett: Cuando la dependencia es positiva θ > 1 y cuando es negativa θ < 1:

Cu,v=1+(θ-1)(u+v)2(θ-1)-1+θ-1u+v2-4uvθθ-12θ-1  con 0θ (14)

La relación de θ con la rho de Spearman es la siguiente:

ρn=θ+1θ-1-2θθ-12ln(θ) (15)

Medidas de asociación

Concordancia

Como la FC caracteriza la dependencia entre las variables aleatorias, es necesario el estudio de las medidas de asociación, para disponer de un método que permita estimar su parámetro θ. En términos generales, una variable aleatoria es concordante (c) con otra, cuando sus grandes valores están asociados a los grandes valores de la otra y los valores pequeños de una con los valores reducidos de la otra. Unas variables con correlación lineal directa serán concordantes; en cambio, unas variables con correlación lineal inversa serán discordantes (d), pues a grandes valores de una, le corresponden pequeños valores de la otra (Salvadori et al., 2007; Chowdhary & Singh, 2019).

El cociente tau de Kendall y el coeficiente rho de Spearman, son dos medidas no paramétricas que proporcionan información sobre una forma especial de asociación o dependencia, la concordancia (Salvadori et al., 2007).

Cociente tau de Kendall

Mide la probabilidad de tener parejas concordantes; por lo cual, es el cociente del número de casos favorables entre el número de casos posibles. El numerador es c-d y el denominador c+d; siendo, c las parejas concordantes y d las discordantes, evaluadas en la ecuación 16. Su expresión para estimarlo con observaciones bivariadas es (Zhang & Singh, 2006, 2019):

τn=2nn-1i=1n-1j=i+1nsignoxi-xjyi-yj (16)

en la ecuación anterior, n es el número de observaciones y el signo[∙] es +1 si tales parejas son concordantes, es decir > 0 y -1 si son discordantes, o sea < 0.

Coeficiente rho de Spearman

Mide la correlación entre parejas de rangos (R i , S i ) de las variables aleatorias X i y Y i . Por ello equivale al coeficiente de correlación (r xy ). Su expresión para estimarlo en un registro bivariado de tamaño n es la siguiente (Chowdhary & Singh, 2019; Zhang & Singh, 2019):

ρn=12n(n+1)(n-1)i=1nRiSi-3n+1n-1 (17)

Estimación del parámetro de dependencia

El método más simple para estimar el parámetro θ de las FC, se asemeja al método de momentos y se basa en la inversión de la ecuación que relaciona a θ con el cociente tau o con el coeficiente rho. Los otros dos procedimientos disponibles se denominan: Método de máxima pseudo-verosimilitud y método exacto de máxima verosimilitud (Meylan et al., 2012; Chowdhary & Singh, 2019; Zhang & Singh, 2019). En las ecuaciones (3), (5) y (15) se procede por tanteos, para obtener θ; en cambio, en las expresiones (8), (10), (12) y (13) se despeja su valor.

Estimación de las probabilidades empíricas

Las probabilidades empíricas bivariadas se estimaron con base en la fórmula de Gringorten, aplicada por Yue y Rasmussen (2002) y Zhang & Singh (2019). Tal fórmula es:

p=i-0.44n+0.12 (18)

en la cual, i es el número de cada dato, cuando están ordenados de manera progresiva y n su número total. La expresión anterior se aplicó en el plano bidimensional, con los datos ordenados en forma progresiva; los gastos máximos (Q) en los renglones y los volúmenes (V) en las columnas. El plano formado es un cuadrado de n por n casillas. Después cada pareja de datos anual (Q y V) se localiza en el plano bidimensional y la casilla definida por la intersección del renglón y columna, se identifica con el número i que corresponde al año histórico procesado.

Cuando las n parejas de datos están dibujadas, se busca el año 1 y se define un área rectangular o cuadrada de valores menores de Q y de V, cuyo conteo de casillas numeradas dentro, es NM 1 o combinaciones de Q y V menores. Calculados los n valores de NM i , se aplica la ecuación anterior para estimar la probabilidad empírica bivariada observada:

FEx,y=wio=NMi-0.44n+0.12(19)

Selección de la función Cópula

Errores estadísticos de ajuste

Permiten aplicar un enfoque simple de selección de la FC, al comparar las probabilidades empíricas observadas wio con las teóricas calculadas wic con tal FC que se prueba. Los indicadores aplicados son el error medio estándar (EME), el error medio absoluto (EMA) y el error absoluto máximo (EAM); sus expresiones son (Chowdhary & Singh, 2019):

EME=1ni=1nwio-wic2 (20)

EMA=1ni=1nwio-wic (21)

EAM=maxi=1:nwio-wic (22)

Dependencia en el extremo superior

Otro criterio que se aplica para seleccionar una FC, es el basado en la magnitud de la dependencia en la cola superior, lo cual tiene impacto en la veracidad de las predicciones extremas. La dependencia en la cola superior derecha λU es la probabilidad condicional de que Y sea mayor que un cierto percentil (s) de F Y (y), dado que X es mayor que tal percentil en F X (x), conforme s se aproxima a la unidad. La dependencia en la cola inferior izquierda λL compara que Y sea menor que X, cuando s se aproxima a cero (Chowdhary & Singh, 2019).

En relación con las FC expuestas, las de AMH, Frank, FGM y Plackett, tienen dependencias insignificantes en sus colas: por ello, λ L =0 y λ U =0. En cambio, la Cópula Gumbel-Hougaard tiene dependencia significativa en la cola superior, igual a: λ U =2 - 2 1/θ y la Cópula de Clayton la tiene en su cola inferior e igual a: λ L =2 -1/θ . Cópulas no expuestas, con λU>0 son las de Galambos, Genest-Ghoudi, Hüsler-Reiss y Joe (Salvadori et al., 2007).

Para intentar la estimación del valor de λ U que muestran los datos disponibles, se define primero la Cópula Empírica. Como la FC caracteriza la dependencia entre las variables aleatorias X y Y, entonces el par de rangos R i y S i procedentes de tales variables y su escalamiento con el factor 1/(n+1) genera una serie de puntos U i y V i en el cuadrado unitario [0,1]2, formando el dominio de la Cópula Empírica (Chowdhary & Singh, 2019). Poulin et al. (2007), proponen el siguiente estimador basado en la Cópula empírica, su expresión es:

λUCFG=2-2exp1ni=1nlnln1Ui∙ln1Vi/ln1maxUi,Vi2 (23)

Periodos de retorno bivariados

El primer periodo de retorno bivariado del evento (X, Y) se define bajo la condición OR, lo cual indica que los límites x ó y, o ambos pueden ser excedidos y entonces, la ecuación clásica del periodo de retorno o inverso de la probabilidad de excedencia será (Shiau et al., 2006):

TXY=1P(X>x or Y>y)=11-FX,Y(x,y)=11-CFXx,FYy (24)

en la cual, F X,Y (x,y) es la FDP bivariada y CFXx,FY(y) es la FC seleccionada.

El segundo periodo de retorno bivariado del evento (X, Y) está asociado al caso en que ambos límites son excedidos (X > x,Y > y) o condición AND (Shiau et al., 2006), su ecuación es:

TXY'=1P(X>x and Y>y)=1FX,Y'(x,y)=11-FXx-FYy+CFXx,FY(y) (25)

Aldama (2000) obtiene la expresión FX,Y'(x,y) de la probabilidad de excedencia bivariada tipo AND, mediante un razonamiento de probabilidades lógico y simple aplicado en el plano cartesiano. En cambio, Yue y Rasmussen (2002) recurren al plano cartesiano para definir numéricamente un evento bivariado (X, Y), que puede ocurrir en alguno de los cuatro cuadrantes.

La relación entre los periodos de retorno bivariados y los univariados es la siguiente (Yue & Rasmussen, 2002; Shiau et al., 2006):

TXYminTX,TYmaxTX,TYT'XY (26)

Siendo:

TX=1FX'(x)=11-FX(x) (27)

TY=1FY'(y)=11-FY(y) (28)

En las ecuaciones 27 y 28, FX'x y FY'(y) son las probabilidades de excedencia univariadas.

Eventos críticos del TXY'

Volpi y Fiori (2012) destacan que la gráfica del periodo de retorno bivariado de tipo AND, mostrada posteriormente como Figura 2, presenta una severa inconsistencia al contener, en un contexto bivariado, umbrales críticos univariados. Debido a lo anterior, tal gráfica se considera integrada por dos porciones, las dos designadas simples y la correcta. Las partes rectas son las colas o rectas asíntotas a la parte curva.

Figura 2 Gráficas de los cuatro periodos de retorno conjunto TXY' de diseño, de las crecientes de entrada a la presa Venustiano Carranza, México 

La probabilidad de ocurrencia de un evento o pareja de Q y V, es variable en la parte curva y decrece a lo largo de la parte recta, aunque todos los valores definen el mismo periodo de retorno conjunto. En resumen, las parejas de valores de las rectas asíntotas tienen probabilidades de ocurrencia bajas y por ello no deben ser incluidas en los análisis de búsqueda de las crecientes (Q y V) críticas o severas.

Selección de las distribuciones marginales

Momentos L y sus cocientes

Por limitaciones de espacio no se exponen las ecuaciones de los momentos L, así como las expresiones de los cocientes L de asimetría (t 3) y de curtosis (t 4); pero ambas se pueden consultar en Campos-Aranda (2014) y en Hosking & Wallis (1997) en su capítulo 2.

Diagrama de cocientes de momentos L

Tiene en el eje de las abscisas a t 3 y en el de las ordenadas a t 4. Las FDP de tres parámetros de ajuste son líneas curvas con las ecuaciones de tipo polinomio siguientes (Hosking & Wallis, 1997):

Logística Generalizada (LOG):

t4LOG=0.16667+0.83333t32 (29)

Pareto Generalizada (PAG):

t4PAG=0.20196t3+0.95924t32-0.20096t33+0.04061t34 (30)

Log-Normal (LGN):

t4LGN=0.12282+0.77518t32+0.12279t34-0.13638t36+0.11368t38 (31)

Pearson tipo III (PT3):

t4PT3=0.12240+0.30115t32+0.95812t34-0.57488t36+0.19383t38 (32)

General de Valores Extremos (GVE):

t4GVE=0.10701+0.11090t3+0.84838t32-0.06669t33+SF (33)

Siendo: SF=0.00567t34-0.04208t35+0.03763t36

Utilizando los logaritmos de los datos se obtienen los cocientes L logarítmicos y entonces se puede utilizar la expresión 32 para valorar la cercanía a la distribución Log-Pearson tipo III.

Distancia absoluta

Uno de los enfoques recientes para la selección de la mejor FDP de una serie de datos, consiste en llevar al diagrama de cocientes L los valores de la muestra (t 3 y t 4) y definir su cercanía a alguna de las curvas, para obtener el mejor modelo probabilístico. Para evitar la subjetividad en la selección de la FDP, se ha propuesto evaluar la Distancia Absoluta (DA) con la expresión siguiente (Yue & Hashino, 2007):

DA=t4t3obs-t4obs (34)

Donde, t3obs y t4obs son los cocientes L de asimetría y curtosis de la serie analizada y t4(t3obs) es el valor teórico del cociente L de curtosis calculado con cada FDP (ecuaciones 29 a 33), para el valor observado del cociente L de asimetría. Una FDP con el menor valor de la DA es la mejor para los datos procesados.

Tres distribuciones de probabilidad seleccionadas

Con el criterio anterior se definieron las tres mejores distribuciones para cada registro de gasto máximo y volumen anuales. Con excepción de la distribución LP3, que se ajustó con el método de momentos en el dominio logarítmico (WRC, 1977), las otras cinco se ajustaron con el método de los momentos L (Hosking & Wallis, 1997).

Errores de ajuste

Este criterio (Chai & Draxler, 2014) complementa al anterior. Cambiando en las ecuaciones 20 y 21, las probabilidades observadas por los datos ordenados de la serie analizada (x i , y i ) y las probabilidades calculadas por los valores estimados x^i,y^i con la FDP que se prueba o contrasta, se obtienen el error estándar de ajuste (EEA) y el error absoluto medio (EAM). Los valores que se estiman se obtienen para la probabilidad de no excedencia, asignada a los datos con la ecuación 18.

Crecientes de entrada a la Presa Venustiano Carranza, México

Aldama et al. (2006) muestran los 52 gastos máximos y sus volúmenes anuales de las crecientes que entran a la Presa Venustiano Carranza (Don Martín), en el estado de Coahuila, México. Su área de cuenca es de 31034 km2. Tal información se tiene en la Tabla 1.

Tabla 1 Gastos máximos, volúmenes y sus números de orden bivariados de las crecientes que ingresaron a la Presa Venustiano Carranza (Don Martín), México (Aldama et al., 2006

Año Q
(m3/s)
V
(Mm3)
NMi Año Q
(m3/s)
V
(Mm3)
NMi
1930 241.0 38.76 19 1956 68.6 13.75 3
1931 89.2 53.59 8 1957 451.2 83.73 36
1932 1071.2 403.78 49 1958 1342.1 529.11 51
1933 203.2 62.10 21 1959 521.6 94.18 38
1934 90.7 11.48 3 1960 99.5 33.31 10
1935 431.2 75.40 34 1961 569.4 161.03 42
1936 62.0 64.75 4 1962 92.8 12.03 4
1937 138.3 19.64 11 1963 340.8 33.13 15
1938 166.3 35.01 17 1964 586.4 156.79 42
1939 134.2 16.99 9 1965 214.6 38.78 19
1940 182.1 21.18 12 1966 76.8 19.12 4
1941 252.1 43.43 21 1967 425.6 215.79 38
1942 339.7 63.62 28 1968 119.6 33.24 11
1943 284.8 35.02 19 1969 50.9 25.81 3
1944 655.9 269.58 46 1970 511.3 246.39 42
1945 146.7 28.04 13 1971 4320.7 983.02 52
1946 243.4 93.00 27 1972 214.2 129.87 25
1947 339.4 63.61 27 1973 449.2 65.18 33
1948 238.4 99.71 27 1974 756.5 244.05 46
1949 97.7 55.93 11 1975 751.6 169.43 44
1950 280.2 71.81 28 1976 614.3 466.05 46
1954 115.5 34.09 12 1995 80.6 13.48 3
1952 114.7 14.87 7 1996 47.6 4.69 2
1953 238.4 99.71 27 1997 87.4 15.96 5
1954 367.0 39.17 23 1998 29.5 3.75 1
1955 213.5 56.00 21 1999 85.0 64.22 7

Resultados y su verificación

Selección de las distribuciones marginales

Verificación de la aleatoriedad

Primero se verificó la aleatoriedad de los registros por procesar, con base en el Test de Wald-Wolfowitz (Rao & Hamed, 2000; Meylan et al., 2012), cuyo estadístico U condujo a valores de 0.726 y 1.054, para los gastos y volúmenes de la Tabla 1.

Distancias absolutas calculadas

En la Tabla 2 se han concentrado los resultados de las ecuaciones 29 a 33, para las seis FDP aplicadas a cada registro de datos de la Tabla 1.

Tabla 2 Distancia absoluta en el diagrama de cocientes L (Hosking & Wallis, 1997) y números de orden de la mejor distribución para las series indicadas 

Gastos máximos anuales (m3/s) Volúmenes anuales (Mm3)
t3 = 0.55039 ln t3 = 0.05374 t3 = 0.57344 ln t3 = 0.04605
t4 = 0.41275 ln t4 = 0.10787 t4 = 0.38702 ln t4 = 0.15555
Distribución LOG 0.0064 (2) Distribución LOG 0.0537 (5)
Distribución GVE 0.0006 (1) Distribución GVE 0.0493 (4)
Distribución LGN 0.0467 (5) Distribución LGN 0.0005 (1)
Distribución PT3 0.1256 (6) Distribución PT3 0.0802 (6)
Distribución PAG 0.0408 (4) Distribución PAG 0.0107 (2)
Distribución LP3 0.0154 (3) Distribución LP3 0.0325 (3)

Distribución de los gastos máximos anuales

En la Tabla 3 se exponen errores de ajuste y predicciones obtenidas con las tres mejores FDP aplicadas al registro de gastos máximos de la Tabla 1. Se observa que las distribuciones GVE y LOG, conducen a los errores de ajuste más bajos del tipo EAM y relativamente reducidos del EEA. Por otra parte, la tercera mejor distribución, la LP3 condujo al EEA más bajo, pero sus predicciones se consideran reducidas. Por lo anterior, se adoptó a la distribución GVE.

Tabla 3 Errores de ajuste y predicciones (m3/s) de las tres mejores distribuciones en el registro de gastos máximos anuales de las crecientes de entrada a la Presa Venustiano Carranza (Don Martin), México 

FDP ajustada: EAM
(m3/s)
EEA
(m3/s)
Periodos de retorno, en años
50 100 500 1000 5000 10000
LOG (2) 59 247 1843 2715 6616 9695 23525 34449
GVE (1) 60 240 1900 2773 6534 9403 21781 31224
LP3 (3) 64 223 2049 2941 6378 8723 17447 23247

Los parámetros de ajuste de ubicación (u 1), escala (a 1) y forma (k 1) de la distribución GVE adoptada son: 160.2069, 137.6956, -0.5178409. La expresión de su FDP es la siguiente (Hosking & Wallis, 1997):

Fx=exp-1-k1x-u1α11/k1 (35)

Distribución de los volúmenes anuales

En la Tabla 4, similar a la Tabla 3, se observa que la mejor distribución la LGN, conduce a errores de ajuste bajos, con predicciones reducidas. La tercera mejor opción, la LP3 reporta los errores de ajuste más bajos, pero sus predicciones son también reducidas. Por lo anterior, se adoptó a la distribución PAG.

Tabla 4 Errores de ajuste y predicciones (m3/s) de las distribuciones indicadas con el registro de volúmenes anuales de las crecientes de entrada a la Presa Venustiano Carranza (Don Martin), México 

FDP ajustada: EAM (m3/s) EEA (m3/s) Periodos de retorno, en años
50 100 500 1000 5000 10000
LGN (1) 11 24 654 926 1877 2463 4385 5516
PAG (2a) 13 28 621 897 2001 2792 5962 8321
LP3 (3) 9 17 685 988 2113 2850 5442 7073
PAG (2b) 14 30 615 864 1798 2429 4797 6397

Los parámetros de ajuste de ubicación (u 2), escala (a 2) y forma (k 2) de la distribución PAG adoptada son: 6.141945, 56.37617 y -0.4577991. La expresión de su FDP es la siguiente:

Fy=1-1-k2y-u2a21/k2 (36)

La aplicación de la ecuación anterior, conduce a valores negativos en el paréntesis rectangular en las parejas de datos números 49 y 51 de la Tabla 1. Lo anterior, significa que el parámetro de ubicación es elevado y por ello, existe el método modificado de momentos L, que corrige tal anomalía (Rao & Hamed, 2000; Campos-Aranda, 2014); el cual conduce a estos nuevos parámetros de ajuste: 2.5067, 64.14948 y -0.4038805; con las predicciones que se muestran en el renglón final de la Tabla 4.

Selección y ratificación de la función Cópula

El procesamiento bivariado de los datos de la Tabla 1, condujo a los siguientes tres indicadores de asociación: r xy = 0.9188, τ n = 0.6471 y ρ n = 0.8274. Por otra parte, en la Tabla 5 se muestran los indicadores estadísticos de ajuste que se obtuvieron al aplicar las FC de Clayton, Frank, Gumbel-Hougaard (GH) y Plackett. En las ecuaciones 20 a 22, las probabilidades bivariadas empíricas se estimaron con la ecuación 19 y las teóricas con las expresiones 7, 4, 9 y 14.

Tabla 5 Indicadores estadísticos del ajuste de las funciones Cópula aplicadas a las crecientes de entrada a la Presa Venustiano Carranza (Don Martín), México 

Cópula θ EME EAM EMA NDP NDN MDP MDN λU
Clayton 3.6667 0.0380 0.0290 0.0873 22 30 0.0873 -0.0699 0.000
Frank 9.3400 0.0281 0.0220 0.0744 28 24 0.0744 -0.0703 0.000
GH 2.8333 0.0254 0.0188 0.0729 27 25 0.0729 -0.0677 0.723
Plackett 30.275 0.0280 0.0210 0.0786 27 25 0.0786 -0.0647 0.000

Significado de los nuevos acrónimos:

NDP, NDN número de diferencias positivas y negativas

MDP, MDN máxima diferencia positiva y negativa

Con base en los resultados de la Tabla 5, no existe dificultad para seleccionar como mejor FC la Gumbel-Hougaard, para los datos de la Tabla 1, debido a que reporta los indicadores estadísticos más reducidos (mostrados en cursivas), es la única que tiene dependencia en su cola derecha y esta se aproxima a la observada (ecuación 23) de λUCFG=0.744.

En la Tabla 6 se muestra una parte de las probabilidades de no excedencia bivariadas, empíricas observadas wio y teóricas calculadas wic con la FC de Gumbel-Hougaard. También se indican sombreadas las diferencias máximas negativa y positiva. Yue (2000) sugirió un contraste gráfico entre ambas probabilidades, para ratificar su adopción, este se expone en la Figura 1 para los datos completos de la Tabla 6.

Figura 1 Contraste gráfico de probabilidades conjuntas del gasto pico y volúmenes de las crecientes anuales de entrada a la Presa Venustiano Carranza, México 

Tabla 6 Probabilidades de no excedencia conjuntas y sus diferencias para una parte de las crecientes anuales de entrada a la Presa Venustiano Carranza, México 

Núm. wio wic Diferencias Núm. wio wic Diferencias
1 0.3561 0.3651 -0.0090 30 0.7206 0.6648 0.0559
5 0.0491 0.0843 -0.0351 34 0.2794 0.3471 -0.0677
10 0.1642 0.1556 0.0086 40 0.0491 0.0563 -0.0071
15 0.8741 0.8642 0.0099 44 0.6247 0.5518 0.0729
20 0.2026 0.1790 0.0236 49 0.0299 0.0175 0.0125
25 0.4328 0.3950 0.0378 52 0.1259 0.1460 -0.0202

Gráficas del periodo de retorno TXY'

Los periodos de retorno bivariado de tipo AND se estiman con base en la ecuación 25. Se consideró conveniente realizar estimaciones para valores del TXY' de 500, 1000, 5000 y 10000 años. De manera arbitraria se seleccionan volúmenes y gastos pico, para obtener sus probabilidades de no excedencia marginales (ecuaciones 35 y 36) y conjunta (ecuación 9). En la Tabla 7 se muestran resultados para definir las cuatro gráficas de la Figura 2.

Tabla 7 Parejas de gasto pico y volumen anual utilizadas para definir las gráficas del periodo de retorno conjunto tipo AND, con la FC de Gumbel-Hougaard, en las crecientes de entrada a la Presa Venustiano Carranza, México 

TXY'
500 años
TXY'
1000 años
TXY'
5000 años
TXY'
10000 años
Vol.
Mm3
Qp
m3/s
Vol.
Mm3
Qp
m3/s
Vol.
Mm3
Qp
m3/s
Vol.
Mm3
Qp
m3/s
0 6534 0 9403 0 21781 0 31224
400 6530 800 9385 1250 21768 2000 31202
500 6526 900 9374 1500 21754 3000 31030
600 6518 1000 9358 1750 21727 3500 30799
800 6486 1200 9308 2000 21688 3750 30633
1000 6416 1400 9219 2250 21625 4000 30432
1100 6356 1600 9066 2500 21534 4200 30244
1200 6272 1700 8954 2750 21404 4400 29982
1250 6217 1800 8808 3000 21216 4600 29663
1300 6152 1900 8612 3250 20948 4800 29270
1400 5979 2000 8351 3400 20742 5000 28783
1500 5721 2100 7986 3500 20576 5100 28481
1600 5312 2150 7747 3600 20390 5200 28149
1650 5002 2200 7450 3750 20042 5300 27789
1700 4558 2250 7073 3900 19611 5400 27358
1750 3816 2300 6568 4000 19252 5500 26897
1775 3133 2350 5828 4100 18836 5600 26342
1790 2328 2400 4486 4200 18328 5700 25659
1795 1754 2410 4000 4300 17714 5800 24895
1798 0 2415 3705 4400 16920 5900 23997
2420 3260 4500 15885 6000 22840
2429 0 4600 14430 6050 22147
4650 13438 6100 21394
4700 12070 6150 20469
4725 11164 6200 19347
4750 9985 6250 17975
4775 8000 6300 16058
4797 0 6350 13255
6397 0

En la Figura 2 o en la Tabla 7 se pueden seleccionar infinitas parejas de Qp y V, que satisfacen el periodo de retorno conjunto de diseño y que se definen como subgrupo de parejas críticas por estar dentro de la porción curva de cada gráfica de TXY', fuera de las rectas asíntotas (Volpi & Fiori, 2012).

Las combinaciones de gasto pico y volumen que tienen el mismo periodo de retorno bivariado de diseño, establecen crecientes o hidrogramas que producirán diferentes efectos en el embalse que se diseña o revisa; adoptando por seguridad, el que genera las condiciones más críticas. Para formar cada hidrograma de diseño, existen métodos teóricos y empíricos (Aldama, 2000).

Contraste de los periodos de retorno bivariados

En la Tabla 8 se muestran los cálculos realizados para llevar a cabo la verificación de la ecuación 26. Se observa y comprueba que en todos los casos el T XY es menor de los T y por el contrario, el TXY' siempre es mayor.

Tabla 8 Diferencias entre los Periodos de retorno univariados y bivariados estimados con la FC de Gumbel-Hougaard, en las crecientes de entrada a la Presa Venustiano Carranza, México 

T = TX= TY QT VT C[FX(x),FY(y)] TXY TXY'
100 2773 864 0.9872451 78.4 138.0
500 6534 1798 0.9974464 391.6 691.4
1000 9403 2429 0.9987227 782.9 1382.9
5000 21781 4797 0.9997446 3915.4 6915.6
10000 31224 6397 0.9998721 7818.6 13831.2

Conclusiones

La ventaja fundamental de usar las funciones Cópula (FC) en el análisis de frecuencias de crecientes bivariado, consiste en poder construir fácilmente la distribución de probabilidades conjunta, con base en unas distribuciones univariadas marginales diferentes, previa estimación de la dependencia entre las variables aleatorias: gasto máximo (Q) y volumen (V) de las crecientes anuales.

El enfoque práctico de aplicación de las FC, requiere una acuciosa selección de las distribuciones marginales y para ello, se empleó el diagrama de cocientes L, para contrastar las tres mejores distribuciones de probabilidad, según sus errores de ajuste y magnitud de sus predicciones y así adoptar las más representativas para Q y V.

Este enfoque práctico de aplicación de las FC, utiliza Cópulas de un solo parámetro de ajuste (θ), que se estima con base en el cociente tau de Kendall o con el coeficiente rho de Spearman, observados entre Q y V. Tal enfoque aplica las FC de Clayton, Frank, Gumbel-Hougaard y Plackett, seleccionando la de mejor ajuste a los datos y que además reproduzca la dependencia (λ U ) observada para los registros disponibles. Bajo tales condiciones se adoptó la FC de Gumbel-Hougaard.

La aplicación numérica descrita, con la muestra de 52 datos de las crecientes anuales de entrada a la Presa Venustiano Carranza (Don Martín), del estado de Coahuila, México; mostró en la Figura 1, una reproducción fidedigna de las probabilidades conjuntas empíricas y teóricas. La Figura 2, relativa a los periodos de retorno conjuntos de diseño de tipo AND, permitirá definir infinitas parejas de Q y V críticas, por estar en la región curva de cada gráfica.

Referencias

Aldama, A. A. (2000). Hidrología de avenidas. Conferencia Enzo Levi 1998. Ingeniería Hidráulica en México, 15(3), 5-46. [ Links ]

Aldama, A. A., Ramírez, A. I., Aparicio, J., Mejía-Zermeño, R., & Ortega-Gil, G. E. (2006). Seguridad Hidrológica de las Presas en México. Jiutepec, Morelos. México: Instituto Mexicano de Tecnología del Agua. 188 pp. [ Links ]

Campos-Aranda, D. F. (2014). Predicción de crecientes usando la distribución Pareto Generalizada ajustada con tres métodos simples. Revista Digital Tláloc, (65), octubre-diciembre. [ Links ]

Chai, T., & Draxler, R. R. (2014). Root mean square error (RMSE) or mean absolute error (MAE)?-Arguments against avoiding RMSE in the literature. Geoscientific Model Development, 7(3), 1247-1250. https://doi.org/10.5194/gmd-7-1247-2014 [ Links ]

Chowdhary, H., & Singh, V. P. (2019). Chapter 11: Multivariate frequency distributions in hydrology, 407-489. En: Statistical Analysis of Hydrologic Variables. Teegavarapu, R. S. V., Salas, J. D., & Stedinger, J. R. (eds.). Reston, Virginia, U.S.A. American Society of Civil Engineers. 548 p. [ Links ]

Favre, A. C., El Adlouni, S., Perreault, L., Thiémonge, N., & Bobée, B. (2004). Multivariate hydrological frequency analysis using copulas. Water Resources Research, 40(1), 1-12. https://doi.org/10.1029/2003WR002456 [ Links ]

Genest, C., & Chebana, F. (2017). Copula modeling in hydrologic frequency analysis, 30.1-30.10. En: Handbook of Applied Hydrology. Singh, V. P. (Ed.). 2nd. Ed. New York: McGraw-Hill Education. [ Links ]

Hosking, J. R., & Wallis, J. R. (1997). Regional frequency analysis. An approach based on L-moments. Chapter 2: L-moments, 14-43, and Appendix: L-moments for some specific distributions, 191-209. Cambridge, England: Cambridge University Press. 224 p. [ Links ]

Meylan, P., Favre, A. C., & Musy, A. (2012). Predictive hydrology. A frequency analysis approach. Boca Raton, Florida: CRC Press. 212 p. [ Links ]

Poulin, A., Huard, D., Favre, A. C., & Pugin, S. (2007). Importance of tail dependence in bivariate frequency analysis. Journal of Hydrologic Engineering, 12(4), 394-403. https://doi.org/10.1061/ASCE1084-0699200712:4394 [ Links ]

Rao, A. R., & Hamed, K. H. (2000). Flood frequency analysis. Introduction, 1-21, and The generalized Pareto distribution, 271-290. Boca Raton, Florida: CRC Press. 350 p. [ Links ]

Salvadori, G., De Michele, C., Kottegoda, N. T., & Rosso, R. (2007). Extremes in nature. An approach using Copulas. Appendix B: Dependence, 219-232, and Appendix C: Families of Copulas, 233-269. Dordrecht, The Netherlands: Springer. 292 p. [ Links ]

Shiau, J. T., Wang, H. Y., & Tsai, C. T. (2006). Bivariate frequency analysis of floods using Copulas. Journal of the American Water Resources Association, 42(6), 1549-1564. https://doi.org/10.1111/j.1752-1688.2006.tb06020.x [ Links ]

Sraj, M., Bezak, N., & Brilly, M. (2015). Bivariate flood frequency analysis using the copula function. A case study of the Litija station on the Sava River. Hydrological Processes, 29(2), 225-238. https://doi.org/10.1002/hyp.10145 [ Links ]

Stegun, I. A. (1972). Miscellaneous functions (Chapter 27, 997-1010). En: Handbook of Mathematical Functions. Abramowitz, M., & Stegun, I. A. (eds.). New York: Dover Publications. Ninth printing. 1046 p. [ Links ]

Volpi, E., & Fiori, A. (2012). Design event selection in bivariate hydrological frequency analysis. Hydrological Sciences Journal, 57(8), 1506-1515. https://doi.org/10.1080/02626667.2012.726357 [ Links ]

WRC. (1977). Guidelines for determining flood flow frequency (Revised edition). Bulletin #17A of the Hydrology Committee. Washington, D. C., U.S.A: Water Resources Council. [ Links ]

Yue, S. (2000). Joint probability distribution of annual maximum storm peaks and amounts as represented by daily rainfalls. Hydrological Sciences Journal, 45(2), 315-326. https://doi.org/10.1080/02626660009492327 [ Links ]

Yue, S., & Rasmussen, P. (2002). Bivariate frequency analysis: discussion of some useful concepts in hydrological application. Hydrological Processes, 16(14), 2881-2898. https://doi.org/10.1002/hyp.1185 [ Links ]

Yue, S., & Hashino, M. (2007). Probability distribution of annual, seasonal and monthly precipitation in Japan. Hydrological Sciences Journal, 52(5), 863-877. https://doi.org/10.1623/hysj.52.5.863 [ Links ]

Zhang, L. & Singh, V. P. (2006). Bivariate flood frequency analysis using the Copula method. Journal of Hydrologic Engineering, 11(2), 150-164. https://doi.org/10.1061/(ASCE)1084-0699(2006)11:2(150) [ Links ]

Zhang, L. & Singh, V. P. (2019). Copulas and their applications in water resources engineering. Cambridge, United Kingdom: Cambridge University Press. 603 p. [ Links ]

Cómo citar: Campos-Aranda, D. F. (2022). Aplicación práctica de las funciones Cópula en el Análisis de Frecuencias Bivariado (Q,V) de Crecientes Anuales. Ingeniería Investigación y Tecnología, 23 (03), pp-pp. https://doi.org/10.22201/fi.25940732e.2022.23.3.023

Recibido: 09 de Septiembre de 2021; Revisado: 23 de Septiembre de 2021; Aprobado: 03 de Junio de 2022

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons