1. Introducción
Desde siempre, la exactitud posicional ha sido considerada como un aspecto definitorio y primordial de la calidad de todo producto cartográfico (Ariza-López, 2002), dado que afecta a factores como la geometría, la topología y la calidad temática, y considerando que está directamente relacionada con la interoperabilidad del dato espacial. Conscientes de la relevancia de este aspecto, numerosas instituciones productoras de cartografía oficial, asociaciones profesionales y cuerpos normativos han desarrollado métodos de evaluación de la exactitud posicional (MEEP), por ejemplo: United States National Map Accuracy Standards (NMAS) (U.S. Bureau of the Budget [USBB], 1947), Especificaciones para mapas topográficos (Instituto Panamericano de Geografía e Historia, 1978), Engineering Map Accuracy Standards (EMAS) (American Society of Civil Engineers [ASCE], 1983), National Standard for Spatial Data Accuracy (NSSDA) (Federal Geographic Data Committee [FGDC], 1998), ASPRS Positional accuracy standards for digital geospatial data (American Society for Photogrammetry and Remote Sensing [ASPRS], 2015), etc.
Los MEEP son procesos estandarizados que permiten, o bien estimar la calidad, o controlarla. La estimación consiste en determinar un valor fiable de la propiedad de interés, mientras que el control de calidad determina si la propiedad de interés alcanza, o no, un nivel determinado. Son diversos los trabajos que comparan algunos de estos métodos (Ariza-López y Atkinson, 2008a) o que los analizan en profundidad desde una perspectiva más estadística, como es el caso del NSSDA en Ariza-López y Atkinson (2008b), el EMAS en Ariza-López, Atkinson y Rodríguez-Avi (2008), el NMAS en Ariza-López y Rodríguez-Avi (2014), etc.
Una de las conclusiones del Proyecto IPGH-PAT 2015 “Diagnóstico de la situación actual sobre las metodologías y procedimientos empleados para la evaluación de la calidad de la Información Geográfica” (Ariza-López y col. 2017) era la existencia de “informalidad” a la hora de realizar las evaluaciones de la exactitud posicional en el ámbito de los países miembros del IPGH. Literalmente se indicaba que "esta informalidad, no sólo significa que no exista una adopción explícita de un MEEP ya existente o una norma o estándar propio, sino que, por lo general, también faltan documentos detallados que restrinjan la variabilidad de las múltiples interpretaciones y opciones que se pueden desarrollar a la hora de aplicar los MEEP existentes".
Consideramos que atender a los aspectos más aplicados de los procesos de evaluación permite mejorar la formalidad. Sin embargo, desde una perspectiva más aplicada son escasos los documentos relevantes que existen, así, el manual sobre el NSSDA (Minnesota Planning Land Management Information Center, 1999) presenta un carácter aplicado pero muy limitado, y otros documentos centrados en esta materia (p.ej. Poggioli, 2010, o el capítulo 3 de Congalton y Green, 2009) no realizan un tratamiento con suficiente detalle y con una orientación de guía aplicable. Desde una perspectiva más general, abarcadora de métodos y didáctica es muy destacable la publicación ocasional número 557 del IPGH titulada Guía general para la evaluación de la exactitud posicional de datos espaciales (Ariza-López et al., 2019a), y desarrollada en el seno del Proyecto IPGH-PAT 2018 nº 23. Esta guía ofrece una compilación con los métodos más aplicados en el continente americano y, además, numerosas directrices sobre cómo afrontar cada uno de los aspectos de la evaluación de la exactitud posicional. Es relevante indicar que esta guía es el resultado de un método de desarrollo de guías que está basado en evidencias (Centro de Estudios e Investigación en Salud, 2014; Ariza-López, 2017), de tal manera que todas sus recomendaciones tienen un respaldo científico. Para más detalles sobre el proceso de elaboración de esta guía ver Ariza-López et al. (2019b).
Sin embargo, en una sociedad digital se requiere que los métodos descritos en documentos se ofrezcan como servicios en entornos digitales distribuidos que faciliten su aplicación por parte del mayor número de usuarios. En esta línea, este artículo presenta la herramienta iCPos (acrónimo de informe de Calidad Posicional) desarrollada por el Grupo de Investigación en Ingeniería Cartográfica (GIIC) de la Universidad de Jaén. Se trata de una herramienta web de acceso libre que incorpora todos los MEEP descritos Ariza-López et al. (2019 a) y que, además, incorpora la generación de un informe de resultados versátil y que puede llegar a ser todo lo exhaustivo que se desee. Además, este servicio se basa en la aplicación de la Norma ISO 19157 (International Organization for Standardization [ISO], 2013), que está siendo revisada bajo la nueva denominación de ISO 19157-1, en todo lo relacionado con la descripción de la calidad de los datos espaciales.
Consideramos que todo este esfuerzo se alinea con la “Visión de Aplicación del Marco Normativo de las Américas” (Naciones Unidas, 2013), el cual indica: "Es preciso definir y adoptar un marco normativo compatible en la región, que establezca las convenciones comunes y acuerdos técnicos necesarios para alcanzar mayor eficiencia en la respuesta a las demandas de información geoespacial, donde los datos se generen y mantengan el común denominador de: compatibilidad, comparabilidad, confiabilidad, consistencia y completitud, siendo éste la base para el establecimiento de un esquema interoperable de colaboración, que contribuya al desarrollo de la Infraestructura de Datos Geoespaciales de las Américas (IDEA).
2. Estado del arte
Las evaluaciones de calidad posicional de productos, tanto digitales como analógicos, han sido una constante dentro de las Agencias de Producción Cartográfica. Sin embargo, los informes existentes se limitaban a presentar el resultado de la aplicación de algún método de control que ha sido convertido en alguno de los estándares “de facto” comentados en la introducción. Desde un punto de vista formal, la introducción de los informes de calidad en la Norma ISO 19115 (ISO, 2003) y en la Norma ISO 19157 (ISO, 2013) fue un paso adelante en cuanto al desarrollo desde un punto de vista más global para informar sobre la calidad y, por lo tanto, del punto de vista específico de la calidad posicional. A pesar de lo anterior, el informe era demasiado generalista y no abordaba todos los aspectos de interés del control posicional. Por ello, el desarrollo por el IPGH del documento 557 (Ariza-López y col., 2019a) supuso un ejemplo claro de lo que se espera de un informe de control de calidad, marcando una línea a seguir.
No obstante, a pesar de la documentación que ha ido desarrollando el aspecto formal del control de calidad posicional, el control ha venido realizándose mediante software general (hojas de cálculo, editores de texto, etc.), o mediante software de uso interno para los productores cartográficos. Pocas de estas herramientas han quedado disponibles para el público general y muchas menos con la capacidad de generar informes de calidad para los diferentes estándares existentes.
Dentro de este ámbito podemos citar las herramientas: (1) DSG Tools1 que permite calcular el método de control posicional por puntos adoptado en Brasil; (2) GeoPEC2 que permite el control posicional usando metodologías basadas en buffers sobre objetos geográficos lineales; y (3) BOS3 desarrollada por Tveite (2020) uno de los investigadores que propusieron este tipo de metodologías. Sin embargo, las herramientas basadas en objetos geográficos puntuales han sido despreciadas ya que se sustituyen por procesos más o menos largos entre capas en los Sistemas de Información Geográfica. En cualquier caso, ninguno de estos sistemas es capaz de generar informes o salidas personalizadas ni realizar ningún tipo de análisis estadístico de los datos de entrada ni de los resultados.
Por otra parte, sin embargo, sí existen herramientas para el aseguramiento de la calidad en aspectos de interoperabilidad. Desde este punto de vista, esfuerzos como los desarrollados en el proyecto ELF (European Location Framework)4 en los aspectos de calidad son muy interesantes ya que marcan un esquema de integración de los procesos de calidad dentro de los sistemas de producción/integración cartográfica según describe Jakobsson et al. (2013) (Figura 1a). Este proceso se concreta en la Figura 1b, para la evaluación y creación de informes de calidad y aseguramiento tal y como los describió Hopfstock (2015). El problema es que estos informes de calidad desarrollados dentro del ELF son fundamentalmente de existencia de atributos y de interoperabilidad. Por ello, este tipo de informes tienen un ámbito bastante diferente al de los informes de calidad posicional donde los estándares “de facto” llevan muchos años en aplicación e integrados tanto en las especificaciones de los productos como en los propios procesos de producción.
Desde un punto de vista más parecido a los informes de calidad propuestos en Ariza-López y col. (2019 a) se destacan los trabajos de Xavier y col. (2015 a y 2015b). En ellos, se realiza una propuesta de creación de un servicio de procesamiento web (WPS) (Open Geospatial Consortium [OGC], 2015) que permite la evaluación de calidad externa usando conjuntos de puntos enlazados para el caso del NSSDA (Xavier et al., 2015a) y para el caso de la Norma UNE 148002 (Asociación Española de Normalización [UNE], 2016) (Xavier et al., 2015b). Como ejemplo mostramos la estructura principal del servicio en la Figura 2.
Tanto el servicio para el NSSDA (Xavier et al., 2015a) y el de la norma UNE 148002 (Xavier et al., 2015b) disponen de una exportación en formato PDF del proceso (Figura 3) y una exportación XML para facilitar el encadenamiento de la salida WPS dentro de otros procesos.
3. Guía para la evaluación de la exactitud posicional de datos espaciales
La guía para la evaluación de la exactitud posicional de datos espaciales elaborada por el IPGH (Ariza-López et al., 2019a) tiene como objetivo “definir y proponer un conjunto de metodologías, procedimientos y normas que puedan ser adoptadas por las instituciones oficiales productoras de cartografía para evaluar la calidad de la Información Geográfica, consiguiendo así homogenizar y estandarizar este importante aspecto de la producción cartográfica dentro de la región”. Por ello, en este documento se relacionan y describen diferentes estándares para el control de calidad posicional y se identifican distintas normas aplicadas en países tanto americanos como europeos basándose en partes de lo desarrollado en Ariza-López et al. (2017). El documento describe las directrices de toma de datos de campo para la evaluación de la exactitud posicional, pero fundamentalmente, los procesos desarrollados en gabinete. La propuesta de control de calidad se centra en el esquema mostrado en la Figura 4, que sigue el esquema de la Norma ISO 19157 (ISO, 2013), donde se determina un elemento de la calidad (en nuestro caso la exactitud posicional) y un ámbito de aplicación. Tras lo cual, se desarrolla la evaluación y se obtiene el resultado que debe ser integrado en un informe.
La guía describe los tres estándares más extendidos en el ámbito de la exactitud posicional, es decir, el NMAS, EMAS y NSSDA, mostrando y definiendo cada uno de los conceptos aplicados y dando ejemplos tanto de la captura de datos en campo como de las muestras a tomar, etc.
Como aspecto fundamental que relaciona la guía con este trabajo se encuentra el informe de calidad independiente, propuesto por la Norma ISO 19157 (2013) y adaptado para el control de calidad posicional. Para ello la guía define una serie de elementos que aparecen en la Figura 5, que se centran en seis aspectos fundamentales:
Identificación del producto a evaluar.
Identificación de los elementos de calidad y las medidas a aplicar.
Descripción de la fuente de mayor exactitud y su información.
Comprobación de las hipótesis estadísticas para las muestras utilizadas.
Resultados del control de calidad
Metacalidad indicando la confianza en el control, la homogeneidad asociada y la representativa del control respecto del producto evaluado.
Sin embargo, para su aplicación práctica, los elementos indicados en la Figura 5, son sólo una idea general que hay que normalizar y adecuar para el desarrollo de una aplicación software o un procedimiento y almacenamiento adecuados. Desde este punto de vista, el GIIC, ha centrado sus esfuerzos en este aspecto para el desarrollo de la aplicación objeto de este documento.
4. La aplicación iCPos
La aplicación iCPos (acrónimo de informe de Calidad Posicional) desarrollada dentro del GIIC de la Universidad de Jaén (España) consiste en una aplicación web de acceso libre que trata de incluir todos los aspectos indicados en Ariza-López et al. (2019a), realizando los cálculos oportunos y creando un informe completo de forma automática para el conjunto de datos de entrada de cada usuario.
Para el desarrollo de la aplicación, tal y como se ha indicado en la sección anterior, ha sido necesario un doble esfuerzo: el primero, la especificación de la estructura lógica del informe; el segundo, el desarrollo de una aplicación web de fácil uso y acceso. Trataremos cada uno de los dos aspectos en las siguientes secciones.
4.1. Diseño de la estructura del informe
Respecto de la estructuración del informe, el trabajo ha consistido en la descripción de los diferentes niveles que desarrollan cada uno de los ítems propuestos en Ariza-López et al. (2019a). Desde este punto de vista, el informe se ha detallado con hasta 4 niveles, como se puede ver en el ejemplo de la Figura 6. Cada nivel se ha catalogado y se ha incluido una descripción de su representación, su carácter (Obligatorio, Opcional o Condicional), el tipo de datos al que pertenece y las unidades (en su caso) a las que debe ser adscrito.
Un aspecto fundamental de este proceso de estructuración es la descripción de aquellos elementos multivaluados, es decir, que pueden disponer de diversas entradas como por ejemplo el caso de las medidas de calidad utilizadas en el control posicional aplicado (Figura 7. Elemento 2.3). En este sentido, se ha realizado un esfuerzo por catalogar como listas estas entradas del informe, como es el caso de los elementos de calidad, las medidas de calidad, los ámbitos de la calidad, etc.
4.2. Desarrollo de iCPos5
Por otra parte, respecto del desarrollo de la aplicación web, si bien, la experiencia mostrada por Xavier et al. (2015a y 2015b) permite el desarrollo de un WPS, al estar basados en la librería TerraLib (Câmara y col., 2008), se ha considerado independizar iCPos para su disponibilidad mediante web y simplificando así el acceso al usuario.
La actual aplicación se basa en un desarrollo WSGI (Web Server Gateway Interface) bajo el estándar de Python 3333 (Eby, 2010) que permite la creación rápida y dinámica de aplicaciones web. El modelo sigue el esquema tradicional en tres capas (Figura 8). La aplicación desarrollada en Python hace de software intermedio o middleware para la interacción entre la capa de presentación, la capa de almacenamiento y la de ejecución. La capa de presentación es un navegador (browser) cualquiera. La capa de almacenamiento se confirma como una base de datos con la información de cada informe individualizado y la gestión de usuarios. La capa de ejecución viene dada por el software Cran-R,6 especializado en estadística y representación gráfica, que se utiliza para la determinación de los diferentes valores de los estándares, verificar el cumplimiento de las hipótesis estadísticas y la obtención de las representaciones gráficas.
El diseño de iCPos se ha realizado para que tanto el almacenamiento de la información como la estructura del informe y de los campos definidos en la propuesta se almacenen como parte de la base de datos, es decir, tanto la lógica de ejecución como los elementos de la presentación, el aspecto del informe e incluso los conjuntos de puntos usados para el control posicional de calidad son almacenados en diferentes tablas. Este procedimiento permite que la aplicación se convierta en un marco donde incorporar no sólo diferentes tipos de informes, o modificaciones a los informes ya realizados, sino también los cálculos desarrollados dentro de la herramienta estadística y la lógica de ejecución. Esto aumenta la flexibilidad para adaptarse a los cambios que puedan surgir en el futuro, otorgando la posibilidad de incorporar idiomas diferentes, nuevos estándares o nuevas medidas.
La aplicación web se ha desarrollado con un interfaz sencillo, actualmente se encuentra en versión beta en la dirección: http://p097-014.ujaen.es:3164/ICPosBeta. Una vez disponible una versión alpha se redireccionará desde esa URL a la dirección de publicación definitiva. Respecto del interfaz, se ha desarrollado una página web dinámica con la forma de la Figura 9, donde se puede navegar por cada una de las grandes secciones del informe. Además, se incluyen opciones para recuperar, almacenar los cambios o realizar el cálculo cuando desee el usuario. Debajo de las secciones, en una zona con diferente fondo se incluyen todos los atributos a introducir para el informe, junto a los cuales se han creado elementos en rojo, amarillo o verde que identifica si son obligatorios, condicionales u opcionales, respectivamente. Los datos de entrada pueden ser introducidos manualmente, mediante archivos de texto u archivos de hojas de cálculo. En un futuro, está planificada la introducción usando otro tipo de archivos generales de información espacial como los Shapefiles de ESRI.
Una parte importante de la propuesta de informe de Ariza-López y col. (2019a) era la necesidad de comprobar hipótesis estadísticas de los errores. Por este motivo, otro de los aspectos más desarrollados en la aplicación, y que la diferencia de otras herramientas, es la capacidad para aplicar, e incluir en el informe, estos análisis estadísticos para verificar las condiciones que deben cumplir los datos, antes incluso de aplicar las medidas de control de calidad. El conjunto de test estadísticos implementados se muestra en la Tabla 1. De esta forma, la aplicación permite determinar si los errores en los puntos de control cumplen ciertas hipótesis. Además, en el caso de la comprobación de la atipicidad, se deja al usuario la opción de utilizar o no los puntos catalogados como atípicos para el resto de comprobaciones estadísticas y el cálculo de las medidas de calidad seleccionadas.
Hipótesis estadísticas | Test propuestos |
Aleatoriedad | Bartels rank test of randomness |
Cox Stuart test of randomness | |
Mann-Kendall rank test of random-ness | |
Atipicidad | K-Sigmas |
Normalidad | K-Smirnov |
Lilliefors corrected | |
Shapiro-Wilk | |
Anderson-Darling | |
Cramer-von Mises | |
Sesgos | t-Student |
Independencia | Pearson |
Homocedasticidad | Levene’s Test |
Bartlett’s Test |
En la parte de resultados del informe, y en cuanto a los estándares de calidad posicional implementados, tal y como se ha comentado anteriormente, se han incluido el NMAS, EMAS, NSSDA y la Norma UNE 148002. En la Figura 10 puede verse un ejemplo de resultados del NSSDA.
Siguiendo en el apartado de resultados del informe, también destacar que otro valor añadido de la aplicación es su capacidad para elaborar mediante Cran-R diferentes gráficos descriptivos de los errores en los puntos de control (Figura 11) que pueden ser incluidos después en el informe, tal y como se sugiere en Ariza-López et al. (2019a). Esta información gráfica permite al usuario detectar la existencia de sistematismos no identificados o la presencia de algún tipo de distribución en los errores, facilitando la toma de decisiones sobre la calidad del producto.
5. Conclusiones
El control de calidad posicional ha sido y sigue siendo una constante en la producción de cartografía y en general de todo tipo de información espacial. No obstante, escaso software público se ha desarrollado para realizar este tipo de controles. Se ha legado su ejecución a cálculos ad-hoc o a programas de uso interno dentro de las propias instituciones.
Sí han existido recientes iniciativas, como es el caso del documento número 557 del IPGH, que tratan de unificar criterios y dar una base común para el control posicional. Esto favorece la elaboración de informes estructurados y el conocimiento, por parte de los usuarios, de la calidad de los productos que usan. En línea con el citado documento, se ha desarrollado la aplicación web iCPos, que permite realizar los oportunos cálculos e informes resultantes.
La aplicación final permitirá crear usuarios, gestionar diferentes controles de calidad, aplicar test estadísticos sobre los errores y definir las medidas a utilizar, así como exportar los resultados y mostrar gráficos descriptivos de esos errores. Esto hace que la aplicación tenga unas capacidades adicionales a las de otras herramientas existentes, y a la ejecución ad-hoc de los controles de calidad posicional. La posibilidad de realizar un pre-procesado en los puntos de control para verificar las condiciones que deben cumplir los datos, y la posibilidad de inclusión de este análisis en el informe (la metacalidad) son aspectos novedosos de dicha herramienta.
La aplicación se ofrece en acceso libre aunque el código siga siendo propietario.
Sin embargo, todavía es una aplicación en desarrollo, ya que es importante su integración como servicio WPS, la inclusión de otros estándares de control de calidad posicional, como el propuesto por la ASPRS, o la capacidad de controlar otro tipo de objetos geográficos como los elementos lineales, que implican otro conjunto de medidas asociadas.