INTRODUCCIÓN
Los países de la Unión Europea afrontan el problema de la contaminación del suelo y los recursos hídricos (Grima et al. 2002), por lo que la Comisión Europea ha establecido programas de monitoreo de la calidad de los recursos naturales. Las redes de control de agua subterránea ponen de manifiesto la presencia en los acuíferos de muchos contaminantes sintéticos (Balderacchi et al. 2013) o de origen natural que no se muestrean habitualmente.
Con frecuencia, los resultados proporcionados por los laboratorios en relación con la concentración de contaminantes en suelo y agua subterránea incluyen valores clasificados por debajo del límite de detección (o cuantificación). Es decir, con concentraciones de las que únicamente se sabe que su valor está por debajo del límite correspondiente, ya que cualquier procedimiento analítico tiene una capacidad de detección finita. El análisis de series con este tipo de valores es complejo, aunque en los últimos años se han producido avances significativos para su interpretación.
Los problemas típicos que deben solucionarse en el caso de que existan valores por debajo del límite de detección (LD) (USEPA 2009) son el cálculo de los valores medios de concentración en una zona. Además, se tienen que establecer los intervalos de confianza de los parámetros considerados para su comparación con estándares, así como la probabilidad de que estos valores medios superen un umbral de concentración.
La Directiva Derivada de Aguas Subterráneas del Parlamento Europeo y el Consejo (PE-CUE 2006) complementa las provisiones de la Directiva Marco del Agua (PE-CUE 2000), y requiere la elaboración de normas de calidad para la protección de los acuíferos. Como consecuencia de la variabilidad natural en la composición química, así como de la inexistencia de redes de observación y control adecuadas de calidad del agua subterránea, se desestimó la elaboración de una lista de estándares de calidad que pudieran aplicarse en todas las masas de agua subterránea en Europa. La Comisión Europea desarrolla, a través del Proyecto BRIDGE, una metodología para establecer los criterios de evaluación del estado químico de los acuíferos para fijar los valores límite de contaminantes en el agua subterránea (Müller 2006). Estos últimos se definen como estándares de calidad establecidos por los Estados miembros, y representan la concentración de un contaminante específico que no debe sobrepasarse con el objeto de proteger la salud humana y el medio ambiente. Las masas de agua subterránea son sistemas complejos que presentan una alta variabilidad no sólo en su geometría y las características hidrodinámicas del medio geológico que los conforma, sino en sus propiedades fisicoquímicas (Ballesteros et al. 2001). Por lo tanto, no tiene sentido definir una concentración única para caracterizar la calidad de un acuífero en su conjunto (Blum et al. 2009).
Por ello, el establecimiento de valores umbrales implica considerar las características hidrogeológicas particulares de las redes de control de aguas subterráneas y sus condicionantes específicos. Para el establecimiento de los valores umbrales con una base científica sólida, se aplicarán metodologías estadísticas basadas en pruebas de hipótesis, mediante las cuales se definirán incrementos estadísticamente significativos. El aumento debe ser superior a lo que podría ocurrir por azar, para lo cual es necesario conocer la variabilidad de los datos. La comparación puede realizarse tanto con valores de fondo (Preziosi y del Bon 2014) calculados a partir de los datos, como con estándares de calidad fijados a partir de un subconjunto de datos o establecidos por las autoridades ambientales.
El resultado de un contraste estadístico de hipótesis puede implicar la clasificación de una masa de agua subterránea como en mal (o deficiente) estado químico desde el punto de vista de la Directiva de Aguas Subterráneas. Los principales objetivos del análisis del estado químico del cuerpo de agua subterránea son: a) comprobar el cumplimiento de los estándares de protección establecidos; b) verificar el empeoramiento significativo de su calidad, o c) establecer la existencia de tendencias significativas de aumento o descenso, en el caso de acciones de recuperación.
El objetivo fundamental de la investigación consiste en el diseño y desarrollo de un procedimiento para la toma de decisiones en cuanto a la clasificación del estado químico de un acuífero (cuerpo de agua subterránea) a partir de valores de concentración de un contaminante por debajo del límite de detección (concentración mínima de sustancia que puede detectarse con fiabilidad), para contrastar la existencia de incrementos significativos en la concentración de un parámetro determinado (Fig. 1). El límite de cuantificación (LC) suele definirse como la desviación estándar del blanco multiplicada por 10 (Saadati et al. 2013). De esta forma, el error α (probabilidad de un falso positivo) es pequeño, del orden del 1 %.
TÉCNICAS DE ANÁLISIS Y OBTENCIÓN DE ESTADÍSTICOS
Se han utilizado diversas metodologías para la comparación de datos procedentes de las redes de control con un estándar de calidad determinado. La más aceptada es la elaboración de intervalos de confianza (Fig. 2). En el caso de analizar la evolución de valores medios, el procedimiento consiste en estimar la media (o mediana) de la población por medio de la muestra (valor básico), calculando un intervalo en el que previsiblemente se encuentre incluido su verdadero valor en vez de estimar el parámetro químico mediante un valor único.
Una de las ventajas de los intervalos de confianza frente a las pruebas de hipótesis tradicionales es la información adicional que proporcionan. Los límites superior e inferior indican las magnitudes máximas o mínimas del parámetro estimado, por lo que es posible descartar valores alejados de dichos límites. Por otra parte, la anchura del intervalo también aporta información valiosa. Un intervalo de confianza estrecho indica que la estimación del parámetro es precisa. Otra forma de expresar lo anterior es decir que el análisis tiene una potencia razonable. En el caso contrario, es decir, cuando el intervalo es muy amplio, la estimación es imprecisa y el estudio tiene poca potencia, lo cual suele suceder en muestras de tamaño pequeño. El límite inferior de confianza es utilizado en el control operativo, cuando el objetivo es verificar si los datos de concentración superan un determinado umbral, mientras que el límite superior se utiliza en las acciones de recuperación. En este último caso se supone la masa de agua subterránea está afectada y el objetivo consiste en evaluar la efectividad de las medidas de recuperación implementadas para la inversión de las tendencias.
Cuando se analizan datos de concentraciones con valores por debajo del límite de detección no debe realizarse ningún tipo de análisis estadístico como si dichos datos no existieran, ya que ello produce una pérdida de información importante y dificulta la interpretación de los resultados. Las principales clases de tratamientos para la determinación de estadísticos básicos en datos ambientales censurados son los siguientes: sustitución, máxima verosimilitud, regresión sobre los estadísticos de orden (Antweiler y Taylor 2008) y técnicas no paramétricas, en concreto el método de Kaplan-Meier (Singh y Totawattage 2013). Únicamente los dos últimos permiten el análisis de conjuntos de datos en los que hay múltiples límites de detección. En este caso, los cuantiles asociados con algunos valores censurados pueden superar los cuantiles de los valores detectados (Helsel 2005), por lo que es necesario utilizar métodos de cálculo diferentes.
Los métodos basados en sustitución son rápidos y muy atractivos por su sencillez. De hecho, en la Directiva 2006/118/CE (Aguas Subterráneas) se dice que “con el fin de evitar sesgos en la determinación de las tendencias, todas las mediciones por debajo del LC se cifrarán en la mitad del LC más alto registrado durante el periodo, con la excepción de los plaguicidas totales” (suma de todos los plaguicidas concretos detectados y cuantificados).
Sin embargo, la sustitución de los valores censurados por LC/2 proporciona resultados sesgados (USEPA 2006) incluso cuando el porcentaje de valores por debajo del límite de detección es sólo del 5-10 %. Como principal inconveniente del método debe mencionarse el hecho de que la elección del valor de sustitución es esencialmente arbitraria y puede provocar errores sustanciales. Por ello, la utilización de este tipo de métodos no es recomendable salvo en los siguientes casos: cuando la muestra sea demasiado pequeña (< 5), la proporción de valores censurados sea inferior al 10-15 % o existan procesos que generen distribuciones diferentes para los valores por debajo del límite de detección, tales como las variaciones estacionales en el nivel piezométrico o la composición del agua subterránea (USEPA 2009).
Incluso, aunque las estimaciones de la media o la mediana sean relativamente buenas con bajos porcentajes de datos censurados, la estimación de la desviación estándar será generalmente deficiente. Esto influirá en el cálculo de los intervalos estadísticos, que a su vez son la base para la toma de decisiones sobre el estado químico de una masa de agua subterránea.
La estimación por máxima verosimilitud se basa en el ajuste de distribuciones conocidas para el cálculo de los estadísticos. Dada una muestra aleatoria simple la función de densidad conjunta de dicha muestra es la que se muestra en la ecuación 1 (Chacón y Míguez 1980):
Esta función tomará valores diferentes en función del valor de θ. Considerando la expresión anterior como una función de θ, L (θ/x 1 , x 2 ,…,x n ) se denomina como función de verosimilitud. Entre los valores posibles de θ, uno es tal que hace máxima la función de verosimilitud. En la práctica se suele tomar el logaritmo de esta función (ecuación 2):
Por tanto, suponiendo que los datos sigan una distribución determinada (generalmente normal o lognormal) se escogen los estadísticos que mejor ajusten los valores por encima del LC y el porcentaje de valores por debajo del mismo. Los estimadores de máxima verosimilitud son más precisos que las gráficas probabilísticas, ya que la raíz cuadrada del error cuadrático medio (RMSE, por sus siglas en inglés) es menor. Ambos métodos consiguen estimaciones sin sesgo cuando los datos presentan un ajuste perfecto a la distribución asumida y el número de datos es grande. En el caso de muestras de tamaño pequeño (n = 5) la estimación es imprecisa y el sesgo grande (Gleit 1985). Igualmente, la presencia de valores anómalos puede distorsionar los estimadores de la media y la desviación estándar, provocando que los valores censurados extrapolados sean incluso negativos. Cuando el porcentaje de datos censurados es alto (superior al 40 %) no es recomendable en general el uso de métodos paramétricos.
El método de regresión robusta para el cálculo de estadísticos asume que los datos siguen una distribución conocida. En general suele utilizarse la distribución lognormal, en cuyo caso la gráfica de probabilidad de los logaritmos ordenados de los datos en función de los cuantiles de una distribución normal estandarizada debería proporcionar una línea recta. Son métodos robustos que proporcionan resultados aceptables incluso en presencia de sesgos acusados (datos no normales), ya que combinan los valores medidos por encima del LC con valores extrapolados, asumiendo una distribución determinada que se fija a los primeros. Dicha distribución se utiliza para extrapolar un conjunto de valores por debajo del límite, aunque éstos no se utilizan como estimaciones de muestras concretas sino como conjuntos de datos con los cuales se estiman los estadísticos.
Las ventajas obtenidas frente a los métodos distribucionales es que no se ven afectados por el ajuste de las distribuciones asumidas al utilizar datos reales. Las estimaciones de los valores extrapolados pueden reconvertirse a su escala original, evitando sesgos en muchas ocasiones inaceptables debido a la transformación (e.g., distribuciones lognormales en series muy asimétricas), resultando en una toma de decisiones incorrecta (USEPA 2002, Singh y Totawattage 2013). Al no haber un límite en el porcentaje de datos censurados -que pueden llegar al 80 %- los resultados deben interpretarse con precaución, especialmente en el caso de muestras de tamaño pequeño. Además, puede utilizarse en presencia de múltiples límites de detección. La regresión sobre los estadísticos de orden en muestras pequeñas es más precisa que la estimación por máxima verosimilitud, por lo que se utiliza generalmente como alternativa en estos casos.
El análisis de supervivencia es un conjunto de procedimientos estadísticos que se emplean para analizar información censurada. Su nombre se debe a que se diseñaron para analizar el tiempo que transcurre hasta que ocurre un suceso, tal como la muerte del paciente en estudios clínicos. Posteriormente se ha aplicado en el campo de la ingeniería para calcular fallos en sistemas mecánicos, adoptando el nombre de teoría de fiabilidad. Existen diferentes tipos de censura: por la derecha, por la izquierda y por intervalo. En el primer caso se sabe que el tiempo de supervivencia es superior a un valor, mientras que en el caso de los datos ambientales su censura es por la izquierda, por lo que sólo se sabe que ciertas concentraciones son menores que una cierta cantidad (generalmente el límite de detección). El tercer tipo combina los dos anteriores, ya que se sabe que la supervivencia se encuentra comprendida entre dos valores.
La función de supervivencia S (t) se define como (ecuación 3):
donde F(t) =∫ 0 t f(u)du.
Los métodos no paramétricos se basan únicamente en los rangos de los datos (Antweiler y Taylor 2008) y no asumen que los datos se ajusten a una distribución conocida. Debido a ello no se ven afectados por la existencia de valores anómalos (frecuentes en datos ambientales), por lo que producen buenos resultados incluso en conjuntos pequeños de datos. Las técnicas más utilizadas para la estimación de la función de supervivencia son las de Kaplan-Meier y Turnbull.
Para una muestra de tamaño N de una población sean t 1 < t 2 <….< t n los tiempos transcurridos hasta la muerte de todos ellos. La aplicación del análisis de supervivencia (tiempo transcurrido hasta un suceso, como puede ser muerte del paciente) al análisis de conjuntos de datos con censura por la izquierda (concentración inferior al límite de detección) se realiza dando la vuelta a la serie y restando sus valores de una constante (nueva serie = constante - serie inicial). De esta forma pueden estimarse la función de supervivencia y los percentiles de los datos originales (Helsel 2005). Para cada t i se definen: d i : número de muertes en el momento i; y n i : número de sujetos en riesgo justo antes de t i .
El estimador de Kaplan-Meier es el estimador de máxima verosimilitud de la función de supervivencia S(t) (ecuación 4):
donde b es el número total de observaciones (detectadas y censuradas) y d el número de observaciones no censuradas.
En general se asume que los valores de concentración en agua subterránea siguen una distribución normal o lognormal. En el primer caso el intervalo de confianza viene definido por la Ecuación 5.
Donde LIC es el límite inferior del intervalo de confianza, LSC el límite superior del intervalo de confianza, α el nivel de confianza, n el tamaño de la muestra, s la desviación estándar muestral y t (1 - α, n - 1) el percentil (1 - α/2) de una distribución t con n - 1 grados de libertad.
En el caso de distribuciones lognormales el intervalo de confianza es más complicado de calcular, ya que debido a los sesgos de la transformación inversa no es posible estimar el intervalo en escala logarítmica y después simplemente exponenciarlos a fin de obtener el intervalo de confianza en su escala original. La ecuación de Cox se utiliza para el cálculo de los límites de confianza (ecuación 6):
donde LIC es el límite inferior del intervalo de confianza, LSC el límite superior del intervalo de confianza, α el nivel de confianza, n el tamaño de la muestra, s la desviación estándar muestral e y el logaritmo natural de los datos
ÁREA DE ESTUDIO Y DATOS
En el marco de la Estrategia Común de Implantación (ECI) de la Directiva Marco del Agua, la totalidad de los estados miembros de la Unión Europea y Noruega acordaron designar una serie de cuencas fluviales piloto para comprobar las diversas cuestiones desarrolladas en los documentos y guías de aplicación de la directiva. En España, se evaluaron estos documentos en la cuenca del Júcar, con el objetivo de proporcionar herramientas para la gestión de sus recursos hidráulicos.
Uno de los requerimientos básicos de las Directivas de Aguas consistió en identificar algunas presiones como la extracción de agua, la contaminación puntual y difusa, y la intrusión salina, y evaluar los impactos en cada masa de agua subterránea con objeto de conocer las causas que condicionan su mal estado químico. Para ello se trasladó la misma metodología desarrollada para las masas de agua superficial, definiendo el riesgo como una combinación de presiones definidas e impactos. La intrusión salina se debe al bombeo de agua subterránea de los pozos cercanos a la línea de costa y provoca la salinización del agua en términos de su composición química. Su importancia es alta, debido a que los pozos se encuentran en zonas densamente pobladas, con actividad económica intensa y, por otra parte, es frecuente la existencia de ecosistemas terrestres dependientes del agua subterránea de alto valor ecológico.
En España, los documentos elaborados fueron evaluados en el ámbito territorial de la cuenca del Júcar (DHJ 2014), que se convirtió de esta manera en el centro de numerosos estudios (Estrela et al. 2004).
En el caso de Chile, la mayoría de la producción agrícola de este país se desarrolla en el Valle Central (Arumí y Oyarzún 2006), donde más de un 83 % del agua potable abastecida en las zonas rurales procede de la explotación de los acuíferos (Pizarro et al. 1999). En el cuadro I se muestran las estaciones seleccionadas en las cuencas piloto del Júcar (España) y de Valle Central (Chile). Debe destacarse el hecho de que no se ha identificado contaminación debida a fuentes puntuales. Por esa razón no hay series de datos con valores por debajo del LC. Como consecuencia, para evaluar el desempeño de métodos específicos de análisis, se han seleccionado series de datos disponibles, en este caso los nitratos, y a posteriori se han censurado artificialmente. Con ello, dado que se conocen los estadísticos de la muestra (media y desviación estándar), es posible analizar el sesgo que introduce cada una de las técnicas empleadas.
Masa de agua subterránea, Plana de Sagunto | |||
Código estación | Longitud | Código estación | Longitud |
CA0820052 CA0821053 JUIG000542 JUIG002683 JUIG002924 JUIG002950 JUIG003137 |
7 5 4 8 8 34 5 |
JUIG003550 JUIG003594 JUIG003835 JUIG003866 JUIG003929 JUIG003940 |
3 17 4 40 4 8 |
Masa de agua subterránea, Valle Central | |||
Código estación | Longitud | Código estación | Longitud |
A B C D E F G H I |
13 13 13 13 13 13 13 13 13 |
J K L M N O P Q |
13 13 13 13 13 13 13 13 |
Con este fin se ha elegido el acuífero de la Plana de Sagunto, ya que se dispone de un conjunto de estaciones con registros históricos. Los materiales acuíferos que conforman la Plana de Sagunto se encuentran representados por niveles detríticos de gravas y/o arenas con espesores en general inferiores a 10-15 m, incluidos en una formación pliocuaternaria fundamentalmente limo-arcillosa (Ballesteros et al. 2005). En la Plana de Sagunto (Fig. 3) hay 13 estaciones con valores por encima del valor umbral para los nitratos (50 mg/L). Las series son de tamaño variable, con datos comprendidos entre 1980 y 2010.
En Chile, el Valle Central se localiza entre los Andes y las cordilleras de la costa. De clima templado, esta zona produce el 83 % de las exportaciones agrícolas de Chile y el 96 % de la producción agrícola nacional (Golembeski 2004). En ella se ubican varias de las regiones vinícolas más conocidas de Chile y otros desarrollos agrícolas entre los que cabe citar el tabaco y el maíz, entre otras.
La conjunción entre un clima con bajas precipitaciones y una elevada disponibilidad de recursos hídricos (procedentes en gran parte del deshielo), en conjunto con la aplicación de manera generalizada de fertilizantes con alto contenido de nitrógeno, provocan la contaminación de las aguas subterráneas.
Debido a la utilización de pozos de poca profundidad para el abastecimiento de agua potable por parte de la población, especialmente trabajadores que desempeñem actividades agrícolas (Golembeski 2004), es particularmente relevante el control de las concentraciones de elementos potencialmente contaminantes del agua subterránea. La presencia potencial de otro tipo de compuestos en el agua subterránea, especialmente elementos sintéticos en concentraciones cercanas al límite de detección, requeriría la utilización de métodos específicos para su detección y corrección.
Se han seleccionado los datos de análisis de concentración de nitratos en agua subterránea de 17 pozos, muestreados en un área cercana a San Fernando, población situada a unos 140 km al sur de Santiago. Las mediciones se iniciaron en febrero de 2001 con frecuencia mensual y continuaron hasta febrero de 2002, lo que supone un total de 13 medidas en cada uno de los emplazamientos (Fig. 4).
El primer paso en el proceso de análisis de series temporales es la representación visual de los datos, con el objeto de identificar patrones, tendencias o variaciones estacionales. Si las observaciones son variables aleatorias independientes e idénticamente distribuidas suele usarse la regresión lineal para modelizar la relación existente entre una variable dependiente y varias variables explicativas. Sin embargo, la aplicación de modelos lineales a datos de concentración de contaminantes en agua subterránea suele ser inadecuada, debido a sus características intrínsecas (sesgo positivo, existencia de valores anómalos, etc.). De hecho, muchas variables de concentración de contaminantes en agua subterránea no están distribuidas normalmente y ni siquiera presentan una distribución simétrica (Montgomery et al. 1987). Para superar esta dificultad se utiliza la regresión local (LOESS) (Helsel y Hirsch 2002) o la regresión local ponderada (LOWESS) (Cleveland 1979). En la figura 5 y el cuadro I se muestran las estaciones seleccionadas de Plana de Sagunto (España) y Valle Central (Chile), el número de registros existentes y las series temporales de las concentraciones de nitratos.
DISCUSIÓN DE RESULTADOS
En el cuadro II se muestran los resultados obtenidos, indicándose de izquierda a derecha, los datos originales y los intervalos de confianza del valor medio calculado por los diferentes métodos. En la primera columna se han incluido las seis estaciones identificadas con su código, de las cuales se cuenta al menos con cuatro valores. En la segunda columna se indican la longitud de las series temporales originales y los límites de confianza de la media. En tercer lugar se indica el porcentaje de censura obtenido de forma artificial con objeto de realizar la simulación. Para ello se han seleccionado los valores correspondientes a los percentiles 12, 25 y 50 % de cada serie y se han hecho corresponder de forma arbitraria con los límites de cuantificación, con objeto de simular de forma aproximada dichos porcentajes de censura.
Código de estación | Plana de Sagunto (España). Intervalo de confianza del valor central | ||||||||
Datos originales | Datos censurados | ||||||||
% datos censurados | Valores sobre el límite de detección | Sustitución | Estimación máxima verosimilitud | Regresión robusta | Kaplan-Meier | ||||
0 | 0.5 límite detección | Límite detección | |||||||
JUIG002683 media=133 sd=139.3 |
N=8 LIC=47.5 LSC=230.3 |
12.5 25 50 |
7 6 4 |
50.1-230.8 46.2-228.1 65.4-200.2 |
49.1-232.2 50.6-231.7 62.1-234.3 |
53.2-229.7 52.9-231.2 80.1-238.4 |
39.8-1455.2 33.7-2629.5 17.6-29791.1 |
49.5-231.2 47.7-236.2 -- |
39.6-231.2 40.7-233.1 136.5-265.4 |
JUIG002924 media=129.4 sd=106.1 |
N=8 LIC=67.7 LSC=203.9 |
12.5 25 50 |
7 6 4 |
63.3-202.5 50.9-199.7 65.4-200.2 |
67.3-202.3 65.4-200.2 65.4-200.2 |
71.6-203.8 65.4-200.2 65.4-200.2 |
64.3-317.4 65.4-200.2 65.4-200.2 |
73.1-202.0 65.4-200.2 65.4-200.2 |
64.2-205.1 65.4-200.2 65.4-200.2 |
JUIG002950 media=157 sd=68.9 |
N=34 LIC=135.1 LSC=180 |
11.7 23.5 41 |
32 16 12 |
129-178.2 64.3-139.1 43.5-119.8 |
132.7-180.4 123-171.5 120-166.5 |
135.5-180.4 179.9-206 194.6-216.7 |
133.2-187.3 101.9-191.1 84.4-181.7 |
135.7-180.3 143-193.1 132.3-198.1 |
135.2-180.6 177.7-204.9 192.5-215.7 |
JUIG003594 media=79.5 sd=40.2 |
N=17 LIC=61.6 LSC=98.7 |
15.3 23.1 46.1 |
12 11 7 |
44.1-92.8 39.4-89.8 18.6-75.5 |
60.8-97.6 59.7-96 54.7-91.6 |
76.1-102.9 78.1-104 88.8-110.4 |
50.5-147.5 47.7-149.8 32.8-163.2 |
69-100.9 67.4-101.4 49.8-101.8 |
74.4-102.6 75.7-103.3 85.3-109.1 |
JUIG003866 media=122.4 sd=75.1 |
N=40 LIC=99.8 LSC=145.5 |
12.8 25.6 48.7 |
33 29 20 |
94-143.1 85.6-139.1 81.2-136.3 |
99.2-145.9 99.5-145.7 100.1-145.8 |
105.1-148.1 113.1-152.1 118.3-155 |
148-1012.7 143.4-1276.6 140.1-1456 |
107-148.9 106.9-152.6 110.7-162.5 |
108.3-149.8 111.9-151.8 116.9-154.6 |
JUIG003940 media=85.9 sd=66.6 |
N=8 LIC=42.9 LSC=130 |
12.5 37.5 50 |
7 5 4 |
39.9-128.1 30.5-127.9 19.5-124 |
43.9-130.1 38-129.2 50.1-130.5 |
46.3-130.5 48.5-130.3 78.9-136.9 |
38.9-256.3 29.1-508.1 21.6-802.7 |
42.4-130.6 50.9-145.9 -- |
41.6-132.8 64.5-137.6 101.7-147.1 |
A media = 65.05 sd = 9.86 | N = 13 LIC = 60.91 LSC = 69.90 | 15.38 23.07 46.15 | 11 10 7 | 46.64-70.48 41.41-67.46 22.34-55.41 | 54.33-69.81 52.6-69.03 43.92-62.81 | 61.01-69.5 64.54-70.26 66.17-70.72 | 58.55-71.18 57.62-71.33 53.07-69.82 | 60-70.51 62-71.68 59-73.31 | 60.53-70.49 64.24-70.99 66.03-71.59 |
B media = 46.85 sd = 12.60 | N = 13 LIC = 41.47 LSC = 52.23 | 15.38 23.07 46.15 | 11 10 7 | 33.62-51.62 29.55-49.78 16.3-43.4 | 38.53-52.29 36.89-51.47 31.79-48.03 | 43.13-52.79 43.92-52.84 45.17-53.09 | 38.96-55.37 37.95-55.53 33.23-55.17 | 40-53.66 40-54.37 36-58.41 | 42.04-54 43.3-54.38 44.49-54.95 |
C media = 36.03 sd = 14.51 | N = 13 LIC = 29.41 LSC = 42.35 | 15.38 23.07 46.15 | 11 10 7 | 24.49-41.95 22.37-41.77 15.14-36.41 | 27.9-41.58 26.41-41.61 24.72-40.89 | 29.33-42.76 30.49-42.82 34.75-44.5 | 27.38-46.64 26.5-47.5 22.24-50.8 | 27-44.25 27-44.86 29-49.49 | 28.19-44 29.17-44.27 35.5-46.29 |
D media = 8.85 sd = 3.36 | N = 13 LIC = 7.43 LSC = 10.42 | 15.38 23.07 46.15 | 11 10 7 | 6.53-10.29 5.22-10.32 3.68-8.71 | 7.12-10.39 6.72-10.56 6.83-9.95 | 8.16-10.61 7.94-10.69 10.1-11.14 | 6.6-12.4 6.35-12.67 5.21-12.81 | 7-10.72 7-10.76 8-11.3 | 7.64-10.73 8.08-10.8 9.97-11.32 |
E media = 21.07 sd = 3.69 | N = 13 LIC = 19.42 LSC = 22.77 | 15.38 23.07 46.15 | 11 10 7 | 14.99-22.81 12.74-21.54 7.38-18.27 | 17.79-22.53 16.89-22.33 14.6-20.62 | 20.09-22.8 20.36-22.88 21.33-23.33 | 18.69-23.32 18.35-23.3 16.75-22.89 | 19-22.98 19-23.15 18-23.19 | 19.81-23.15 20.02-23.21 21.27-23.72 |
F media = 127.31 sd = 66.27 | N = 13 LIC = 99.03 LSC = 158.11 | 15.38 23.07 46.15 | 11 10 7 | 84.99-151.88 76.96-150.86 49.81-136.37 | 91.71-154.43 89.3-154.58 87.38-149.58 | 97.61-154.76 99.35-155.88 119.6-164.08 | 89.87-179.94 86.53-185.62 70.59-208.77 | 87-166.45 82-163.22 75-179.74 | 92.14-163.87 92.52-164.19 118.17-173.59 |
G media = 296.12 sd = 150.19 | N = 13 LIC = 232.84 LSC = 363.23 | 15.38 23.07 46.15 | 11 10 7 | 218.37-364.23 202.84-355.68 136-321.09 | 225.05-360.25 218.29-359.43 227.63-351.3 | 235.66-363.36 243.7-366.2 318.71-384.5 | 193.52-549.24 185.78-594.9 142.27-687.76 | 228-375.42 248-399.37 310-421.35 | 222.95-378.89 271.98-385.27 370.33-414.56 |
H media = 171.06 sd = 121.43 | N = 13 LIC = 116.93 LSC = 226.06 | 15.38 23.07 46.15 | 11 10 7 | 107.67-221.57 101.96-222.12 78.57-207.64 | 116.71-224.14 112.93-224.34 108.16-221.31 | 114.81-222.83 124.98-224.36 140.78-233.19 | 98.93-362.67 94.63-404.42 72.66-640.89 | 113-234.46 106-248.67 107-291.39 | 107.37-238.17 119.29-241.58 138.91-249.31 |
I media = 203.48 sd = 71.33 | N = 13 LIC = 170.7 LSC = 234.53 | 15.38 23.07 46.15 | 11 10 7 | 138.4-228.77 125.88-224.31 78.78-201.15 | 158.78-232.33 149.68-230.5 135.04-218.62 | 176.72-235.27 173.38-232.96 193.1-243.8 | 161.69-250.31 156.96-252.84 134.32-257.32 | 157-248.26 158-247.7 135-272.11 | 167.67-243.15 175.07-245.38 188.93-251.38 |
J media = 150.88 sd = 58.07 | N = 13 LIC = 126.19 LSC = 177.03 | 15.38 23.07 46.15 | 11 10 7 | 112.52-175.47 101.99-174.51 60.2-150.75 | 120.53-178.47 120.28-173.91 116.99-168.22 | 130.45-177.33 136.03-177.33 172.14-188.24 | 110.53-218.81 106.52-226.08 86.18-227.4 | 121-185.25 140-188.31 158-196.79 | 126.32-182.75 146.08-184.6 177.28-192.85 |
K media = 87.30 sd = 68.65 | N = 13 LIC = 55.26 LSC = 115.81 | 15.38 23.07 46.15 | 11 10 7 | 48.8-114.62 45.67-110.8 30.47-101.86 | 51.84-114.99 49.11-115.83 48.21-111.36 | 56.42-114.79 58.52-115.79 62.27-118.29 | 53.59-138.82 51.23-146.16 40.45-185.28 | 53-129.75 52-122.5 39-133.75 | 50.54-125.21 52.83-126.37 56.42-129.16 |
L media = 70.22 sd = 28.11 | N = 13 LIC = 58.40 LSC = 81.94 | 15.38 23.07 46.15 | 11 10 7 | 50.54-82 46.69-81.09 26.94-69.58 | 54.33-81.72 53.67-81.18 51.66-78.36 | 58.73-82.83 59.37-82.41 74.38-87.3 | 52.16-96.92 50.44-100.08 41.35-101.41 | 59-86.79 60-87.17 58-91.45 | 55.49-85.67 65.52-87.19 73.62-90.1 |
M media = 90.81 sd = 30.88 | N = 13 LIC = 78.00 LSC = 104.06 | 15.38 23.07 46.15 | 11 10 7 | 63.81-104.19 56.96-102.97 36.12-89.44 | 72.19-104.25 66.57-103.02 68.82-100.32 | 78.11-105.0 78.46-104.2 99.74-111.65 | 71.39-113.92 69.25-115.52 58.92-118.82 | 70-109.18 73-111.44 86-117.48 | 74.59-107.84 74.62-107.94 99.82-113.96 |
N media = 42.48 sd = 25.62 | N = 13 LIC = 31.51 LSC = 54.06 | 15.38 23.07 46.15 | 11 10 7 | 27.67-52.8 25.56-51.8 18.73-48.36 | 29.57-52.41 28.44-53.19 27.21-54.79 | 31.15-53.84 31.25-53.13 38.28-59.02 | 27.76-67.6 26.65-71.38 21.22-89.06 | 29-54.37 27-57.81 25-66.37 | 28.53-56.54 28.73-56.67 39.17-60.26 |
O media = 38.86 sd = 10.31 | N = 13 LIC = 34.43 LSC = 43.29 | 15.38 23.07 46.15 | 11 10 7 | 27.92-43.05 23.56-40.66 15.34-35.88 | 30.8-42.32 29.59-42.06 25.72-39.88 | 34.17-43.24 34.83-43.28 37.33-44.42 | 32.62-45.02 31.84-45.21 28.09-45.52 | 32-45.05 31-44.45 29-49.18 | 33.36-44.54 33.72-44.67 36.3-45.61 |
P media = 71.11 sd = 28.26 | N = 13 LIC = 58.59 LSC = 84.00 | 15.38 23.07 46.15 | 11 10 7 | 52.62-83.48 44.57-80.59 28.35-70.75 | 56.1-82.67 57.33-82.78 50.8-77.92 | 60.46-83.38 66.04-85.11 70.93-87.31 | 53.38-97.13 51.41-98.62 42.45-100.98 | 59-83.6 59-88.54 60-89.26 | 61.04-87.18 64.44-88.09 74.23-92.16 |
Q media = 216.72 sd = 68.16 | N = 13 LIC = 187.59 LSC = 245.52 | 15.38 23.07 46.15 | 11 10 7 | 157.77-246.64 138.63-237.57 82.74-208.34 | 173.54-246.03 168.11-246.11 154.46-231.14 | 60.46-83.38 66.04-85.11 70.93-87.31 | 172.85-270.17 167.9-274.03 143.25-275.32 | 175-257.19 189-258.87 206-279.24 | 183.92-254.34 201.08-257.03 240.41-269.02 |
LIC - LSC = Límite de Confianza Inferior-Superior
sd = desviación estándar
Los resultados obtenidos, que se presentan en el cuadro II, indican la necesidad de aplicar métodos específicos de análisis estadístico para el estudio de conjuntos de registros en los cuales no se han podido cuantificar algunas observaciones debido a las limitaciones de los métodos analíticos. Dado que las redes de monitoreo oficiales se han utilizado tradicionalmente para el análisis de componentes mayoritarios, no existen valores por debajo del límite de detección, ya que las concentraciones medidas son muy superiores a la precisión de los instrumentos. El desarrollo progresivo de la normatividad referente a la protección y conservación del medio ambiente por parte de las administraciones públicas, requiere que se midan concentraciones cada vez menores de sustancias potencialmente contaminantes para compararlas con estándares de calidad.
Para ello se han seleccionado series temporales con valores de concentración de nitratos cuyos estadísticos (media y desviación estándar) se han calculado con métodos tradicionales. A continuación, se han supuesto porcentajes de censura del 15 al 45 %, aproximadamente, y se han aplicado métodos de sustitución y de imputación para el cálculo de los intervalos de confianza de la media, con el objeto de comparar el límite superior de dichos intervalos con los estándares de calidad. Entre los primeros se ha simulado la sustitución de los valores censurados por 0, por la mitad del límite de detección y por este último valor. Entre los métodos de imputación se han considerado la estimación de máxima verosimilitud, la regresión robusta y el método de Kaplan-Meier.
Como puede observarse en el cuadro II, tanto en las series analizadas en la Plana de Sagunto como en el Valle Central, la sustitución de valores censurados por 0 introduce sesgos a la izquierda en el cálculo de los intervalos de confianza de la media, que se incrementan en el mismo sentido que el porcentaje de valores por debajo del límite de detección. Del mismo modo, la sustitución de los valores censurados por el límite de detección introduce un sesgo a la derecha. En el caso de sustitución por la mitad del límite de detección, el sesgo, de menor magnitud, depende igualmente del porcentaje de censura, pero se produce de forma errática, por lo que no es posible predecir su dirección. Cuando el número de registros es inferior a 10, como es el caso de algunas de las estaciones de la Plana de Sagunto, este efecto es más acusado, aunque para porcentajes elevados de censura ninguno de los métodos proporciona estimaciones precisas a medida que disminuye el número de datos.
Los métodos de regresión robusta y de Kaplan-Meier, por otra parte, son los que proporcionan resultados más aproximados a los datos reales y con longitudes menores del intervalo de confianza correspondiente. A medida que aumenta el porcentaje de censura, sin embargo, la longitud de los intervalos obtenidos también aumenta.
CONCLUSIONES
Los métodos de sustitución introducen sesgos en las estimaciones de la media o la mediana, por lo que deben evitarse, ya que distorsionan los intervalos de confianza generados y por tanto disminuyen la potencia de los ensayos de conformidad con los estándares ambientales. En otras palabras, aumenta la probabilidad de falsos negativos, con las implicaciones que ello supone en la toma de decisiones con relación a la calidad de los recursos hídricos. Lo mismo sucede con la eliminación directa de los valores por debajo del LC, ya que ello supone introducir (o eliminar) señales en el conjunto de los registros.
Los métodos basados en regresión robusta y el método de Kaplan-Meier son los procedimientos recomendados, ya que proporcionan una mayor precisión. Cuando hay varios límites de cuantificación como resultado de la mejora en la precisión de los métodos analíticos o debido al cambio en las técnicas de análisis o laboratorio, el segundo es el de referencia, ya que puede manejar varios procedimientos.
Por tanto, la utilización de dichos métodos implica un mayor grado de protección al medio ambiente, ya que indican que existe falta de verificación del estándar ambiental o de detección de fugas de compuestos peligrosos, antes que los otros métodos contemplados. Además, se recomienda un mínimo de 10-15 muestras por encima del límite de detección para obtener resultados precisos.
La frecuencia de muestreo es un factor limitante al momento de obtener conclusiones en series temporales, ya que frecuencias de muestreo inferiores a un cuatrimestre pueden producir efectos de autocorrelación en las medidas, especialmente en terrenos de permeabilidad media-alta. A este respecto, cabe citar que los datos analizados en el Valle Central de Chile presentan p-valores inferiores a 0.05 en los ensayos de correlación de residuos mediante la prueba tau de Kendall.
Por último, es necesario comprobar la existencia de tendencias al aumento en la concentración de contaminantes de forma previa a la realización de cualquier análisis estadístico, con objeto de eliminar su influencia.
A pesar de lo anterior, cuando la muestra es pequeña (cinco valores o menos) no es posible aplicar de forma precisa alguna técnica de análisis de datos censurados. En este caso la sustitución por la mitad del límite de detección es la alternativa viable, al menos hasta que existan suficientes valores para realizar un análisis apropiado.
En definitiva, la aplicación de técnicas estadísticas específicas para el análisis de valores de concentración de contaminantes por debajo del LC, obtenidos en las redes de monitoreo de la calidad de los recursos hídricos, es una parte esencial del proceso de toma de decisiones en cuanto a la clasificación de un cuerpo de agua subterránea como en buen o mal estado. Los intervalos de confianza del valor central obtenidos de esta forma también pueden aplicarse cuando es necesario comprobar la efectividad de las medidas de recuperación de un cuerpo de agua subterránea, y no se tienen más elementos para comparar con el límite superior del intervalo de confianza.