37 
Home Page  

  • SciELO

  • SciELO


Atmósfera

 ISSN 0187-6236

NAVARRO CESPEDES, Juan Manuel et al. A comparison of missing value imputation methods applied to daily precipitation in a semi-arid and a humid region of Mexico. []. , 37, e53095.   17--2023. ISSN 0187-6236.  https://doi.org/10.20937/atm.53095.

^a

Climatological data with unreliable or missing values is an important area of research, and multiple methods are available to fill in missing data and evaluate data quality. Our study aims to compare the performance of different methods for estimating missing values explicitly designed for precipitation and multipurpose hydrological data. The climate variable used for the analysis was daily precipitation. We considered two different climate and orographic regions to evaluate the effects of altitude, precipitation regime, and percentage of missing data on the Mean Absolute Error of imputed values and performed a homogeneity evaluation of meteorological stations. We excluded meteorological stations with more than 25% missing data from the analysis. In the semi-arid region, ReddPrec (optimal for nine stations) and GCIDW (optimal for eight stations) were the best-performing methods for the 23 stations, with average MAE values of 1.63 mm/day and 1.46 mm/day, respectively. In the humid region, GCIDW was optimal in ~59% of stations, EM in ~24%, and ReddPrec in ~17%, with average MAE values of ~6.0 mm/day, 6.5 mm/day, and ~9.8 mm/day, respectively. This research makes a valuable contribution to identifying the most appropriate methods to impute daily precipitation in different climatic regions of Mexico based on efficiency indicators and homogeneity evaluation.

^len^a

Los valores poco confiables o ausentes en datos climatológicos son una importante área de investigación, y existen varios métodos disponibles para completar los datos faltantes y evaluar la calidad de los mismos. Nuestro estudio tiene como objetivo comparar el rendimiento de diferentes métodos de estimación de valores faltantes diseñados explícitamente para la precipitación y datos hidrológicos. La variable climática utilizada para el análisis fue la precipitación diaria. Consideramos dos regiones climáticas y orográficas diferentes para evaluar el efecto de la altitud, régimen de precipitación y porcentaje de datos faltantes sobre el Error Absoluto Medio de los valores imputados, y realizamos una evaluación de homogeneidad en las estaciones meteorológicas. Se excluyeron del análisis las estaciones meteorológicas con más del 25% de datos faltantes. En la región semiárida, los métodos con mejor desempeño fueron el ReddPrec el cual resultó óptimo en nueve estaciones y el GCIDW en ocho, de un total de 23 estaciones, con valores promedio de MAE de 1.63 mm/día y 1.46 mm/día, respectivamente. En la región húmeda, el método GCIDW fue óptimo en ~59% de las estaciones, el EM en ~24% y el ReddPrec en ~17%, con valores promedio de MAE de ~6.0 mm/día, 6.5 mm/día y ~9.8 mm/día, respectivamente. Esta investigación realiza una valiosa contribución para identificar los métodos más adecuados para imputar la precipitación diaria en diferentes regiones climáticas de México con base en indicadores de eficiencia y evaluación de homogeneidad.

^les

: .

        · | |     · |