INTRODUCCIÓN
En la República Argentina, el sector agropecuario es considerado uno de los principales recursos económicos, tanto como generador de divisas como abastecedor de su mercado interno. De esto se deriva que el estudio, inventario y conocimiento de la superficie cultivada adquiera significativa importancia para la posterior planificación agrícola y económica. En dicho territorio, la agricultura se vincula principalmente a cereales como trigo, cebada, maíz, avena y sorgo y a oleaginosas como girasol, maní (cacahuate) y soja. Entre las regiones productoras más importantes del país se encuentra la región pampeana, dentro de la cual se halla emplazado el partido de Coronel Rosales (Buenos Aires, Argentina). No obstante, dicho partido se halla localizado en un área de clima semiárido, razón por la cual los cultivos alcanzan menor desarrollo que en el resto de la región pampeana.
Esta última característica, junto a la diversidad en las fechas de siembra y en la tecnología empleada, implica un desafío en la discriminación de cultivos mediante teledetección, especialmente cuando se trata de cultivos de ciclo fenológico muy similar como en el caso del trigo y la cebada. De hecho, ambos cultivos presentan un aspecto muy similar durante su etapa de máximo desarrollo, cuya identificación, incluso en el terreno, no siempre resulta inmediata (Figura 1). Para subsanar estos inconvenientes, los métodos habituales de clasificación de imágenes satelitales se han basado en la respuesta espectral individual de cada píxel generalmente empleando imágenes ópticas. En tal sentido, en la República Argentina se ha empleado con eficacia el Índice de Diferencia Normalizada de Vegetación (Normalized Difference Vegetation Index - NDVI) tanto para determinar diferentes usos del suelo como para discriminar cultivos (Volante et al., 2006; Vázquez et al., 2006; Marini, 2016; Marini y Ángeles, 2016).
En lo referente al monitoreo de cultivos utilizando imágenes Radar de Apertura Sintética (SAR), estos presentan diversas ventajas con respecto a los ópticos, siendo la principal el hecho de que las ondas de radio no se ven afectadas por la presencia de nubes. Esto brinda la oportunidad de contar con datos satelitales durante la totalidad del ciclo fenológico de los cultivos, es decir, desde su siembra hasta su cosecha. En tal sentido, la banda C se considera una longitud de onda adecuada para la discriminación de cultivos (Mc Nairn et al., 2009; Skriver et al., 2011), ya que su retrodispersión SAR es muy sensible a los cambios, especialmente durante la etapa de desarrollo (Mc Nairn y Shang, 2016).
La mayor parte de los trabajos aplicados a detección de cultivos y uso del suelo con imágenes SAR solía efectuarse utilizando datos multiparamétricos (Blaes et al., 2005; Loosvelt et al., 2012; Jiao et al., 2014; Chen et al., 2015; Schmullius et al., 2015), así como la fusión de datos SAR e imágenes ópticas (Mc Nairn et al., 2009; Skakun et al., 2015). No obstante, en los últimos años la Agencia Espacial Europea (ESA) ha lanzado el satélite SAR Sentinel1A, cuyos datos son de disposición libre y gratuita. Esto generó que diversas investigaciones centradas en clasificaciones de cultivos empleasen series temporales Sentinel-1A aprovechando las mencionadas ventajas de la banda C de dicho satélite (Veloso et al., 2017; Kenduiywo et al., 2018; Whelen y Siqueira, 2018; Xu et al., 2019). Esto implica tanto el empleo de diversos algoritmos de clasificación como la adición de medidas como textura y coherencia, que también han demostrado ser idóneas en la detección de cultivos (Jia et al., 2012; Yayusman y Nagasawa, 2015).
El objetivo de este trabajo consiste en discriminar dos cultivos de invierno de ciclos fenológicos similares como el trigo y la cebada en el partido de Coronel Rosales mediante el uso de datos SAR, de imágenes ópticas y de la combinación de ambos tipos de datos. Para cumplimentar dicho objetivo, se incorporaron imágenes de coherencia, textura e intensidad de retrodispersión extraídas de los datos SAR derivados del satélite Sentinel-1A durante el ciclo fenológico completo de ambos cultivos de invierno.
ÁREA DE ESTUDIO
El Partido de Coronel Rosales se localiza en el sudoeste de la provincia de Buenos Aires dentro de la región pampeana austral, una de las de mayor relevancia agro-productiva del país, y presenta una superficie de 1340 km2 (Figura 2). Dicho partido posee una población de 62 152 habitantes (INDEC, 2011), siendo su cabecera la ciudad de Punta Alta. Desde el punto de vista agroecológico, presenta dos unidades de paisaje con características geomorfológicas y edáficas bien diferenciadas. La primera de estas unidades ocupa el 31% del territorio y se halla conformada por una faja litoral de dunas costeras con alturas variables que en algunos sectores se intercala con áreas planas u onduladas interdunícolas. Los establecimientos agropecuarios localizados en esta unidad de paisaje son los de menor aptitud agrícola debido al predominio de suelos pertenecientes al Orden de los Entisoles (Suborden Psamentes) con textura arenosa y alta permeabilidad y susceptibilidad a la erosión eólica (INTA, 1989). La segunda unidad de paisaje ocupa la mayor parte del área de estudio y se caracteriza por relieves pedemontanos con una cubierta loéssica de espesor variable conformando lomadas y ondulaciones con presencia de costras calcáreas superficiales o subsuperficiales (denominadas bajo el localismo tosca). El 47% de los establecimientos agropecuarios del partido se localizan en esta unidad y poseen un predominio de suelos pertenecientes al Orden de los Molisoles (Suborden Udoles) con una textura franca gruesa, escurrimiento medio y susceptible a erosión eólica (INTA, 1989).
El clima puede considerarse como templado de transición con temperaturas moderadas y una precipitación media anual de 602 mm (Valles y Silva Busso, 2016). No obstante, el régimen de precipitaciones suele ser errático, concentrándose durante la primavera y el verano, decreciendo en otoño y alcanzando los valores mínimos durante el invierno. Esta característica del régimen de precipitaciones, sumada a la baja capacidad de retención de agua de los suelos y a los períodos de sequía recurrentes, condicionan tanto la producción agropecuaria como la ganadera. La temperatura media anual es de 16.2 °C, siendo enero el mes más cálido (24 °C) y julio el más frío (7 °C) (RADAR, 2001). Los vientos son moderados registrándose velocidades medias entre 9 y 13 km/h con direcciones dominantes N-NO (Saldungaray et al., 2012).
Las condiciones agroecológicas de la región definen la aptitud del partido para el desarrollo de actividades mixtas agrícola-ganaderas o ganadero-agrícolas. En lo concerniente a la agricultura, predominan los cultivos de invierno, en especial el trigo y la cebada de cosecha, y en menor medida algunos cultivos de verano como el sorgo, generalmente utilizado como forraje para la ganadería, y el maíz. No obstante, en los últimos años las condiciones climáticas, las socioeconómicas y las políticas macroeconómicas han impactado notablemente en el sistema productivo provocando, entre 1988 y 2002, una disminución del 27% de los establecimientos agropecuarios (EAP) de menos de 500 ha (Álamo y Garabito, 2012) y un descenso del stock ganadero del 26% para el período 2008-2010 (Saldungaray et al., 2012).
DATOS
Imágenes satelitales ópticas y SAR
Se utilizaron imágenes Sentinel-2 seleccionándose seis fechas representativas de los distintos estados fenológicos de cada cultivo (de acuerdo con la disponibilidad de las mismas y a la ausencia de nubes). Las fechas empleadas fueron las siguientes (escenas HNC, HNB, HPC y HPB): Año 2017: 21 de julio, 11 de septiembre, 29 de octubre, 18 de noviembre y 25 de diciembre. Año 2018: 7 de enero. Dichas escenas fueron descargadas de la página de la misión ESA - European Space Agency destinada a tal fin (https://scihub.copernicus.eu). Las imágenes fueron luego procesadas utilizando la proyección UTM 20 Sur (datum WGS 1984). A fin de contar con parámetros comparables en el tiempo, se obtuvo el valor de reflectancia en cada banda utilizada.
Por otra parte, se emplearon imágenes SAR del satélite Sentinel-1A. Esta misión opera en banda C (frecuencia central: 5.405 GHz) con una revisita que ocurre a los 6 días con los dos satélites en órbita en esta constelación. Sentinel-1A permite obtener imágenes en cuatro modos diferentes (European Space Agency - ESA, 2013): Stripmap (SM), Interferometric Wide Swath (IW), Extra-Wide Swath (EW) y Wave Mode (WM). En este estudio, se han empleado siete imágenes en modo IW con una polarización dual (producto Single Look Complex - SLC) cuyo detalle se presenta en la Tabla 1. El modo IW combina un ancho de escena de 250 km con una resolución moderada de 5 x 20 m.
Fecha de adquisición | Producto | Modo | iPolarización |
6 de septiembre de 2017 | SLC | IW | VV/ VH |
18 de septiembre de 2017 | SLC | IW | VV/ VH |
12 de octubre de 2017 | SLC | IW | VV/ VH |
30 de octubre de 2017 | SLC | IW | VV/ VH |
5 de noviembre de 2017 | SLC | IW | VV/ VH |
5 de diciembre de 2017 | SLC | IW | VV/ VH |
29 de diciembre de 2017 | SLC | IW | VV/ VH |
Recopilación de datos en el terreno
El trabajo en el terreno (noviembre de 2017) consistió en un relevamiento del partido de Coronel Rosales con ayuda de un GPS con el fin de obtener verdades de campo. Se recolectaron datos de cultivos de invierno (trigo y cebada de cosecha), así como de lotes con diferentes usos del suelo (campo natural, pastura, rastrojos de cultivos de invierno, pastizales y verdeos invernales). De esta manera, se georreferenciaron 218 lotes que se agruparon en cinco categorías: 1) trigo, 2) cebada, 3) cultivos de verano de cosecha, 4) uso forrajero (incluye tanto pasturas implantadas como pastizales naturales de buen desarrollo y verdeos de invierno) y 5) no laboreado (engloba a lotes que no evidenciaron manejo alguno durante la presente campaña agrícola). El 50% de las muestras recopiladas en el terreno fue utilizada como polígonos de entrenamiento y 50% restante se empleó en la validación de cada clasificación obtenida (Tabla 2). En el sector central de cada uno de los lotes de las cinco categorías involucradas, se delinearon áreas en forma de polígonos irregulares apoyándose visualmente en una imagen satelital Sentinel-2, constituyéndose así los mencionados polígonos de entrenamiento y de validación.
METODOLOGÍA
Preprocesamiento de imágenes ópticas y SAR
Las imágenes SAR Sentinel-1A fueron pre procesadas con el software SNAP 6.0, lo que incluyó la creación de una imagen multilook (Multilooking), filtrado de ruido speckle, geocodificación y calibración radimétrica. El filtro utilizado fue el Lee, que fue aplicado mediante una ventana de 3 x 3 píxeles para reducir el ruido speckle. Las imágenes SAR fueron remuestreadas a un tamaño de pixel de 20 metros de resolución espacial mediante una interpolación bilineal y los valores obtenidos de coeficiente de retrodispersión sigma cero fueron convertidos a decibeles (dB). Asimismo, se realizó una corrección de las distorsiones geométricas SAR utilizando el Modelo Digital de Elevación (MDE) SRTM 3 sec, que se descarga automáticamente de la web.
En el caso de las imágenes Sentinel-2, las correcciones atmosféricas se realizaron con el software QSIG. En cada una de éstas se calculó el Índice Normalizado de Diferencia de Vegetación (Normalized Difference Vegetation Index - NDVI). Dicho índice es la diferencia normalizada entre dos bandas: rojo e infrarrojo cercano (Rouse et al., 1974). Los valores obtenidos oscilan entre los extremos 1 (vegetación muy densa) y -1 ausencia total de vegetación). Una vez obtenidos los valores de NDVI como bandas para cada fecha utilizada, se las reunió en una sola imagen multibanda (apilado o stacking) sobre la que se aplicaron posteriormente los diferentes métodos de clasificación.
Atributos específicos
Textura
La textura (T) es un parámetro significativo que contribuye a mejorar la precisión en la clasificación de los datos SAR, pudiéndose cuantificar mediante una serie de diferentes medidas estadísticas. Asimismo, ha sido vastamente empleada en la clasificación de cultivos (Jia et al., 2012; Du et al., 2015; Yayusman y Nagasawa, 2015; Balzter et al., 2015). En este artículo se utilizó la Matriz de Co-Ocurrencia de Nivel Gris - GLCM (Haralick et al., 1973), ampliamente utilizada para obtener entidades de textura. En tal sentido, se extrajeron las siguientes ocho medidas de textura: media, varianza, entropía, segundo momento angular, contraste, correlación, disparidad y homogeneidad.
Coherencia
Se denomina coherencia (C) al coeficiente de correlación que explica los pequeños cambios producidos en las distintas superficies (área vegetadas, no vegetadas, rocas, etc.) durante el intervalo de tiempo entre dos adquisiciones de SAR (Parihar et al., 2014). En tal sentido, el uso de los productos en nivel SLC permitió la obtención de este parámetro, ya que contienen información de amplitud y de fase. Los valores de coherencia oscilan entre 0 y 1 y se relacionan con cambios en el píxel. Un coeficiente de coherencia elevado indica que dicho cambio es pequeño, mientras que un coeficiente de coherencia bajo señala un cambio significativo. Para el presente artículo se obtuvieron seis imágenes de coherencia utilizando los siguientes pares de datos SAR para 2017: 1) 6 y 18 de septiembre, 2) 18 de septiembre y 12 de octubre, 3) 12 y 30 de octubre, 4) 30 de octubre y 5 de noviembre, 5) 5 de noviembre y 5 de diciembre y 6) 5 y 29 de diciembre.
Combinación de atributos
En virtud de lograr la mejor la precisión posible en la discriminación del trigo y de la cebada, se analizó la potencialidad de las diversas variables SAR y de las imágenes ópticas tanto en conjunto como por separado. Para ello, se consideraron diferentes combinaciones de variables (Tabla 3) que fueron identificadas con un número (ID)
ID | Combinación de bandas | Número de bandas |
Tipo de imagen |
1 | Polarización VV bandas Sentinel-1A | 7 | SAR |
2 | Polarización VH bandas Sentinel-1A | 7 | SAR |
3 | Polarización dual (VV + VH) bandas Sentinel-1A | 14 | SAR |
4 | NDVI de imágenes Sentinel-2 | 6 | Óptica |
5 | Polarización dual (VV + VH) bandas Sentinel-1A + NDVI de imágenes Sentinel-2 |
20 | SAR + Óptica |
6 | Coherencia Polarización VV bandas Sentinel-1A | 6 | SAR |
7 | Coherencia Polarización VH bandas Sentinel-1A | 6 | SAR |
8 | Coherencia Polarización dual (VV+VH) bandas Sentinel-1A | 12 | SAR |
9 | Polarización dual (VV + VH) + Coherencia Polarización dual (VV + VH) bandas Sentinel-1A |
26 | SAR |
10 | Textura Polarización dual (VV + VH) de bandas Sentinel-1A | 112 | SAR |
11 | Polarización dual (VV + VH) + Textura Polarización dual (VV + VH) bandas Sentinel-1A |
126 | SAR |
12 | Coherencia Polarización dual (VV + VH) + Textura Polarización dual (VV + VH) de bandas Sentinel-1A |
124 | SAR |
13 | Polarización dual (VV + VH) + Coherencia Polarización dual (VV + VH) + Textura Polarización dual (VV + VH) de bandas Sentinel-1A |
138 | SAR |
14 | Polarización dual (VV + VH) + Coherencia Polarización dual (VV + VH) + Textura Polarización dual (VV + VH) bandas Sentinel-1A + NDVI de imágenes Sentinel-2 |
144 | SAR + Óptica |
Clasificación
Las diferentes localidades que conforman el partido fueron enmascaradas en forma manual. Por otra parte, las lagunas y los cuerpos de agua de menor magnitud fueron discriminados empleando una clasificación No Supervisada mediante el método Isodata (Datos Auto Asociados Iterativamente).
Para discriminar cada una de las cinco categorías involucradas en este estudio, se emplearon tres reconocidos clasificadores: el método de Máxima Verosimilitud (Maximum Likelihood - MLC), el de Máquinas de Soporte Vectorial (Support Vector Machines - SVM) y el de Random Forest (RF). Para la clasificación de imágenes se empleó el software SNAP 6.0
Uno de los clasificadores paramétricos más empleados en teledetección ha sido el MLC (Foody et al., 1992; Jia et al., 2012). Este asume una determinada distribución estadística para cada clase valiéndose de un modelo probabilístico en donde las funciones de distribución de probabilidad siguen una distribución normal multivariante cuyos parámetros, vector de medias y matriz de covarianza, se estiman a partir de las muestras de entrenamiento recopiladas. De esta manera, la clase a la que pertenece un determinado píxel quedará determinada mediante el cálculo de su probabilidad de pertenencia a todas las clases definidas, asignándosela a aquella en la que se haya obtenido la máxima probabilidad (Ahmad y Quegan, 2012).
El SVM, por su parte, es uno de los clasificadores no paramétricos más utilizado en determinación del uso del suelo con imágenes satelitales en virtud de sus muy buenos resultados (Jia et al., 2012; Pal y Foody, 2012). Las máquinas de soporte vectorial fueron originariamente desarrolladas para resolver problemas de clasificación binaria. Consisten en un conjunto de algoritmos de aprendizaje supervisado (Cortes y Vapnik, 1995), actualmente empleado en regresión, agrupamiento o multiclasificación. El modo de operar de los SVM es mediante la selección de un hiperplano de separación equidistante de las muestras de entrenamiento más cercanos de cada clase, obteniéndose un margen máximo a cada lado de este. En el momento de definir dicho hiperplano, se consideran solo los ejemplos de entrenamiento de cada clase que se hallen comprendidos en la frontera de dichos márgenes, y que se denominan vectores soporte (Riobó Otero, 2012; Carmona Suárez, 2016).
Finalmente, se empleó el método Random Forest, basado en un conjunto de árboles de decisión y también aplicado con éxito en problemas de clasificación y regresión (Breiman, 2001). Este algoritmo incorpora la aleatoriedad en la construcción de cada clasificador individual, logrando mejorar la precisión en la clasificación. De hecho, esta técnica produce predicciones altamente precisas y permite manejar un gran número de variables de entrada sin proporcionar sobreajuste. Random Forest introduce aleatoriamente en cada nodo del árbol de decisión un conjunto de variables entre todas las originales y de éstas selecciona la mejor para realizar la partición. Tanto las variables como las reglas de división de los nodos son diferentes para cada árbol, lo que asegura su heterogeneidad, obteniéndose resultados diferentes. Los errores individuales de cada árbol de decisión quedan compensados, ya que la asignación final se realiza por mayoría (Larrañaga Urien, 2016). Este algoritmo requiere principalmente de dos parámetros: el número de variables utilizadas al azar para cada división (variables predictivas) y el número de árboles de clasificación. Para el primer caso, se ha utilizado el valor implementado por defecto por el software SNAP, es decir 5000. En el segundo caso se ha optado por el criterio propuesto por Belgiu y Dragut (2016), quienes han establecido que diversos estudios avalan el número de 500 árboles de decisión como el adecuado para obtener una óptima Precisión Global.
Para evaluar cada clasificación realizada se generó una matriz de confusión, en donde se compara el mapa obtenido de cada una de las clasificaciones de las imágenes satelitales con las verdades de campo. De dicha matriz se deriva la Precisión global (P), que proviene del cociente entre el total de píxeles correctamente clasificados sobre el total de píxeles correspondientes a las verdades de campo (Jensen, 1986). Los resultados de la clasificación efectuada serán mejores cuanto más cercano al 100% sea el valor de P.
Asimismo, se obtuvieron los valores de F1. Esta medida es considerada aún de mayor significancia que P (Schuster et al., 2015), y emplea los porcentajes de precisión del productor y precisión del usuario derivados de la matriz de confusión. Su fórmula de cálculo es:
Los valores de F1 oscilan entre 0 y 1. Valores cercanos a 1 indican muy buenos resultados y aquellos cercanos a 0 sugieren pobres resultados. En este trabajo, F1 se ha expresado en porcentaje (%).
RESULTADOS Y DISCUSIÓN
Análisis de variables multitemporales obtenidas de datos SAR
La Figura 3 presenta la evolución temporal de los valores de retrodispersión media expresados en decibeles (dB) para cada una de las cinco clases involucradas en este estudio. En líneas generales, los valores de la polarización VH son relativamente menores en comparación con los de VV. No obstante, en esta última polarización las cinco categorías (a excepción de la cebada en la imagen del 12 de octubre) exhiben oscilaciones entre fechas inferiores a 4 dB. La retrodispersión media de VH del trigo y de la cebada disminuye de -20.91 dB y -20.88 dB en la escena del 6 de septiembre a -21.71 dB y -22.77 dB en la del 12 de octubre respectivamente. En el caso de la retrodispersión VV, dicha disminución es más marcada, pasando de -14,68 dB y -15.38 dB en la escena del 6 de septiembre a -18.38 dB y -18.72 dB en la del 12 de octubre. Durante esta primera etapa de crecimiento de ambos cultivos, la principal influencia en la señal del radar es ejercida por el suelo. A medida que dichos cultivos invernales alcanzan su mayor grado de desarrollo, los valores de retrodispersión para ambas polarizaciones comienzan a aumentar, alcanzando sus picos máximos en la imagen del 5 de noviembre. Con el crecimiento gradual del trigo y de la cebada, la densidad de las hojas y de las varillas también aumenta gradualmente, por lo cual la superficie del suelo se cubre de modo uniforme. Por otra parte, la retrodispersión en la polarización VV para ambos cultivos fue mayor que la de VH, porque tanto el trigo como la cebada poseen una estructura vertical que incide más en la primera de dichas polarizaciones durante el proceso de desarrollo. Una vez que ambos cultivos han sido cosechados (imagen del 29 de diciembre), la mayor influencia en la señal del radar vuelve a ser la ejercida por el suelo, especialmente en la polarización VH, menos sensible a la estructura de estas plantas.
La Figura 4 exhibe la serie temporal de los valores medios de coherencia para cada una de las cinco clases involucradas en este estudio. El trigo y la cebada presentan, en líneas generales, los valores de coherencia más bajos de las cinco categorías para ambas polarizaciones. El primero de estos alcanza su mayor valor durante el par de datos del 30 de octubre al 5 de noviembre para la polarización VV (0.28), coincidentemente con su mayor desarrollo. Esto se condice con lo señalado por Blaes et al. (2005), quienes encontraron una fuerte correlación entre la altura del trigo de invierno y su valor de coherencia. No ocurre lo mismo con la cebada, cuyo máximo valor de coherencia ocurre durante el par de datos del 5 al 29 de diciembre (0.28). De modo opuesto a los cultivos invernales, los cultivos de verano exhiben los valores de coherencia más elevados, especialmente en la polarización VV (0.42). Esto último tiene que ver con el escaso cambio experimentado en los lotes de tales cultivos durante esta etapa fenológica (barbecho y siembra) en la que aún no alcanzan su mayor grado de desarrollo.
Análisis de variables obtenidas de imágenes satelitales ópticas
La Figura 5 muestra la serie temporal del NDVI promedio para cada cobertura terrestre. Como se observa, los valores de NDVI para trigo y cebada se incrementan paulatinamente desde julio a octubre, en donde se observan los valores más elevados (0.74 y 0.69, respectivamente) en correspondencia con su mayor grado de crecimiento. Luego dichos valores disminuyen paulatinamente hasta alcanzar sus mínimos (0.20 y 0.23, respectivamente) durante el período de cosecha. Las tres clases restantes se caracterizan por exhibir menor oscilación a lo largo del ciclo fenológico. Esta diferencia de comportamiento en la evolución de dicho ciclo entre un cultivo y un lote con otro uso de suelo ha sido ampliamente utilizada en la clasificación remota (Karale et al., 2014).
Clasificación y precisión de imágenes y variables SAR
La precisión general y la medida F1 para las cinco clases involucradas en este estudio utilizando clasificadores MLC, RF y SVM se muestra en la Tabla 4.
Clasificador | ID | Medida F1 | Precisión | ||||
No laboreado | Cultivo de verano | Uso forrajero | Trigo | Cebada | |||
MLC | 1 | 58.92 | 59.12 | 28.20 | 59.71 | 73.91 | 61.21 |
2 | 47.11 | 78.15 | 47.21 | 66.54 | 65.32 | 62.60 | |
3 | 63.25 | 80.02 | 52.61 | 69.90 | 76.62 | 70.76 | |
4 | 77.89 | 91.75 | 80.86 | 78.43 | 79.69 | 80.62 | |
5 | 80.49 | 94.40 | 90.58 | 81.64 | 78.80 | 82.81 | |
6 | 58.92 | 59.12 | 28.20 | 59.71 | 73.91 | 61.21 | |
7 | 34.64 | 26.88 | 16.54 | 36.68 | 49.04 | 37.73 | |
8 | 46.25 | 48.43 | 24.18 | 49.89 | 64.82 | 51.26 | |
9 | 69.23 | 83.46 | 50.51 | 73.93 | 81.80 | 75.34 | |
10 | 50.57 | 76.61 | 27.76 | 17.80 | 67.96 | 52.79 | |
11 | 51.38 | 77.62 | 28.12 | 19.02 | 68.47 | 53.50 | |
12 | 51.38 | 77.62 | 28.13 | 19.02 | 68.48 | 53.50 | |
13 | 60.99 | 80.75 | 24.07 | 27.70 | 69.66 | 57.93 | |
14 | 81.01 | 95.75 | 77.68 | 61.08 | 71.66 | 73.91 | |
SVM | 1 | 71.06 | 20.78 | 46.38 | 62.07 | 76.73 | 63.86 |
2 | 51.42 | 47.62 | 80.89 | 67.97 | 67.69 | 65.47 | |
3 | 65.11 | 51.46 | 83.73 | 71.65 | 78.97 | 73.11 | |
4 | 79.13 | 90.05 | 50.01 | 82.54 | 80.85 | 79.16 | |
5 | 82.72 | 87.41 | 88.34 | 80.53 | 81.76 | 82.86 | |
6 | 71.06 | 20.78 | 46.38 | 62.07 | 76.73 | 63.86 | |
7 | 25.81 | 7.88 | 18.72 | 43.00 | 50.85 | 39.93 | |
8 | 46.52 | 23.80 | 56.91 | 57.67 | 68.65 | 57.34 | |
9 | 63.99 | 57.95 | 76.60 | 75.79 | 81.98 | 74.65 | |
10 | 71.57 | 63.29 | 85.10 | 76.91 | 80.56 | 77.17 | |
11 | 71.47 | 61.36 | 85.24 | 76.72 | 80.88 | 77.12 | |
12 | 67.09 | 64.08 | 77.70 | 79.12 | 83.16 | 77.07 | |
13 | 67.02 | 63.17 | 77.84 | 78.48 | 82.95 | 76.75 | |
14 | 87.35 | 84.70 | 92.87 | 84.64 | 85.12 | 86.35 | |
RF | 1 | 39.06 | 13.24 | 50.79 | 53.81 | 65.92 | 52.68 |
2 | 56.42 | 60.85 | 81.82 | 69.26 | 69.29 | 68.07 | |
3 | 67.11 | 62.09 | 82.03 | 74.89 | 81.93 | 75.78 | |
4 | 75.44 | 89.57 | 25.51 | 82.95 | 84.15 | 77.65 | |
5 | 75.06 | 96.20 | 33.14 | 86.48 | 86.57 | 80.23 | |
6 | 39.20 | 12.68 | 50.69 | 54.13 | 66.62 | 52.93 | |
7 | 26.54 | 7.72 | 16.96 | 42.42 | 47.03 | 37.98 | |
8 | 46.90 | 13.13 | 55.63 | 56.68 | 67.30 | 56.29 | |
9 | 72.25 | 66.14 | 81.95 | 78.20 | 84.73 | 78.97 | |
10 | 70.21 | 61.40 | 82.64 | 77.90 | 83.77 | 77.90 | |
11 | 70.54 | 62.50 | 82.61 | 78.26 | 83.68 | 78.09 | |
12 | 76.25 | 62.60 | 84.06 | 79.16 | 85.15 | 80.20 | |
13 | 73.53 | 65.33 | 82.65 | 79.74 | 84.94 | 79.74 | |
14 | 89.66 | 96.48 | 90.55 | 87.27 | 89.20 | 89.37 |
En líneas generales, RF es el clasificador que ha obtenido los mejores resultados en comparación a MLC y SVM, en términos de F1 (Tabla 4). En lo referente a la discriminación de trigo y de cebada, éste también ha resultado el clasificador óptimo. No obstante, todas las medidas de F1 para trigo y cebada que utilizan la polarización única (ID 1 y 2) fueron inferiores al 69.29%. Mejores resultados se obtuvieron de la combinación de las polarizaciones VV y VH (ID 3) que tomando cada polarización por separado (ID 1 y 2). En este caso, los valores de F1 se incrementan a 74.89% para el trigo y 81.93% para la cebada. Esto se debe principalmente a que la suma de dos polarizaciones con diferentes mecanismos de dispersión proporciona información más rica de dispersión de ondas de radar, en este caso en cultivos de invierno, mejorando la precisión de la clasificación.
Con el fin de explorar completamente los datos de Sentinel-1A buscando mejorar la precisión de la clasificación, se incorporaron como nuevas variables la información de textura y coherencia. La Tabla 4 muestra que la precisión de la clasificación en principio no mejora al emplear imágenes de coherencia, tanto para cada polarización por separado (ID 6 y 7) como para la unión de VH y VV (ID 8). Sin embargo, al analizar la imagen de la coherencia aplicada a VV y VH combinada con los valores de dichas polarizaciones por separado (ID 9), los valores de F1 se incrementan. En el caso del trigo, alcanzan el 78.20% y para la cebada el 84.73%, empleando RF. En este sentido, estudios anteriores refieren a mejoras en la clasificación al combinan medidas de intensidad de retrodispersión con coherencia (Parihar et al., 2014; Sonobe et al., 2015). Cuando a las imágenes de intensidad de retrodispersión se les añadieron las de textura (ID 11), los valores de F1 son similares a los que solo involucran esta última medida (ID 10), obteniéndose valores de F1 de 78.26% para el trigo y 83.68% para la cebada empleando RF (P: 78.09). Del mismo modo, las combinaciones que involucran coherencia y textura (ID 12) arrojan valores de P y F1 análogos a los mencionados, incluso al incorporar la polarización dual (ID 13). Estos resultados corroboran la utilidad tanto de la coherencia como de la textura como parámetros idóneos para la clasificación de datos SAR. En lo referente a la precisión general de la clasificación, los mejores resultados se obtuvieron empleando la combinación de imágenes de coherencia y textura (ID 12), con un valor de P de 80.20.
Cabe acotar que al emplear el clasificador SVM tanto sobre información de textura como en la combinación de datos SAR del ID 13, los resultados obtenidos fueron similares al aplicar el método RF, obteniéndose un valor de F1 levemente superior para el trigo (78.48%) y levemente inferior (82.95%) para la cebada (P: 76.75). Los resultados hasta aquí expuestos, tanto para los clasificadores RF como SVM, indican que los datos SAR por sí solos cumplen aceptablemente los requisitos de precisión de clasificación para cultivos de invierno. Aunque con ciertas limitaciones, estos pueden reemplazar el uso de imágenes ópticas. Para el resto de las otras tres categorías involucradas, el clasificador RF también fue el más eficaz utilizando la combinación ID 12 para discriminar las clases uso forrajero (F1: 84.06%) y no laboreado (F1: 76.25%). Por su parte, los cultivos de verano exhiben en todos los casos valores de F1 inferiores a los de las dos clases mencionadas, alcanzando su máximo valor de F1 en la combinación ID 13 (65.33%). Los mejores resultados para los cultivos estivales empleando dicha combinación de datos se obtuvieron utilizando MLC (80.75%), aunque los valores de la clasificación general fueron muy pobres (P: 57.93). La dificultad de discriminar tales cultivos guarda relación con el escaso grado de desarrollo que los mismos alcanzan durante esta etapa fenológica. En este caso, y a diferencia de lo que ocurre con los cultivos de invierno, el SAR no es sensible a cambios en la estructura morfológica (Gao et al., 2018).
Clasificación y evaluación de la clasificación empleando imágenes satelitales ópticas
La clasificación empleando solo imágenes ópticas (ID 4) aplicando el NDVI arrojó mejores resultados que las imágenes SAR solas, a pesar de que el trigo y la cebada poseen ciclos fenológicos similares. No obstante, la mayor separabilidad entre dichos cultivos de produce durante el período de su máximo desarrollo (Figura 6). También se aprecia, a diferencia de las imágenes de radar, que los tres métodos empleados exhiben resultados similares. En lo que a la clasificación general se refiere, los valores de P oscilan entre 77.65% para el método RF y 80.62% aplicando MLC. En cuanto a la separabilidad de ambos cultivos de invierno, los tres métodos empleados también presentan resultados análogos. No obstante, el mejor algoritmo que separa los cultivos de invierno es RF, con un valor de F1 de 82.95% para el trigo y de 86.57% para la cebada.
Clasificación empleando datos SAR e imágenes ópticas
La precisión de la clasificación de los cultivos de invierno utilizando la combinación ID 5, es decir VV y VH de datos SAR junto a la información de los datos ópticos (apilado de NDVI) mejoró con respecto a la de estos últimos por sí solos, con valores de F1 de 86.48% para el trigo y de 86.57% para la cebada empleando el método RF. Del mismo modo, la precisión general de la clasificación también supera al valor para las imágenes ópticas multitemporales, especialmente al aplicar SVM, aumentando del 79.19% al 82.86%. Para el resto de las clases también mejoraron las precisiones de clasificación, en particular en el caso de los cultivos de verano, que alcanzaron un valor de F1 de 96.20% aplicando RF. En el caso de la categoría uso forrajero, el máximo valor de F1 para esta combinación de datos se registra empleando MLC (90.58%), mientras que los lotes no laboreados han sido discriminados mejor con SVM (F1: 82.98%). Estos resultados corroboran diversos estudios previos en donde también se ha demostrado que la precisión de la clasificación podría mejorarse cuando se combinan las imágenes SAR con las ópticas (Blanes et al., 2005; Mc Nairn et al., 2009; Ban y Jacob, 2013; Skakun et al., 2015). En tal sentido, Zhou et al. (2017) señalan que la razón podría deberse a que mientras las imágenes ópticas contienen abundante información espectral, los datos SAR aportan más información de textura espacial. De esta manera, la combinación de ambas imágenes compensaría los defectos de cada una de ellas en la identificación de cultivos, mejorando la precisión de la clasificación.
Finalmente, se llevó a cabo una clasificación sobre una combinación integral (ID 14) que involucra los datos SAR del ID 13 sumados a la información de NDVI de las imágenes ópticas (ID 4). Como se muestra en la Tabla 4, la precisión de la clasificación tanto para el trigo como para la de cebada, es la más elevada de todas las clasificaciones efectuadas. Esto se verifica empleando el algoritmo RF, con valores de F1 de 87.27% para el trigo y de 89.20% para la cebada. Debido a que esta clasificación fue la que mejores resultados obtuvo, su correspondiente matriz de confusión se exhibe en la Tabla 5.
Clase | No laboreado | Uso forrajero | Cultivo de verano | Trigo | Cebada |
No laboreado | 87.72 | 2.40 | 0.95 | 4.30 | 3.37 |
Uso forrajero | 0,00 | 96.77 | 0.56 | 0.80 | 4.94 |
Cultivo de verano | 8.53 | 0,00 | 98.49 | 0,00 | 0,00 |
Trigo | 0,00 | 0,00 | 0,00 | 90.34 | 6.97 |
Cebada | 3.75 | 0.83 | 0,00 | 4.56 | 84.72 |
Total | 100.00 | 100.00 | 100.00 | 100.00 | 100.00 |
Aunque en menor medida, el método SVM obtiene valores de F1 ligeramente inferiores para ambos cultivos invernales (84.64% y 85.12% para trigo y cebada, respectivamente). Para el resto de las categorías, ambos logaritmos muestran óptimos resultados, reflejados en porcentajes de F1 que superan el 84%. En tal sentido, los cultivos de verano alcanzan un 96.48% empleando RF sobre esta combinación de datos. La clasificación resultante de emplear el método RF sobre la combinación integral de datos SAR e imágenes ópticas (ID 14) se muestra en la Figura 7.
De los resultados expuestos se evidencia que la combinación de imágenes ópticas y SAR multitemporales mejora la precisión de la discriminación de cultivos. De hecho, algunos autores señalan que cuando dicha precisión es superior al 85%, la clasificación del cultivo es confiable (Foody, 2002; De Wit y Clevers, 2004; Skakun et al., 2015). Esto último ha podido corroborarse en el presente estudio al emplear dicha combinación de datos, reforzando la potencialidad de las imágenes SAR en la mejora de la precisión de la clasificación. Asimismo, las imágenes de radar no solo se erigen como sustituto de imágenes las ópticas, sino también como una fuente de datos suplementaria, especialmente cuando la presencia de nubes imposibilita la adquisición de imágenes ópticas (Chen y Pei, 2007; Jia et al., 2012).
CONCLUSIONES
En líneas generales, los resultados obtenidos en este trabajo corroboran que el empleo de datos multitemporales que involucren la combinación de imágenes ópticas y SAR es idóneo para la discriminación de cultivos. En tal sentido y de manera específica, se evidencian las siguientes consideraciones finales:
De los tres algoritmos de clasificación empleados, RF obtuvo los mejores resultados para la discriminación de trigo y cebada. Esto también es válido para las clasificaciones generales, tal como se desprende de los valores de Precisión Global.
Quedó demostrado que el uso de datos SAR del satélite Sentinel-1A permitió discriminar de manera óptima los cultivos de invierno. La combinación VV + VH + C+ T (ID 13) arrojó los mejores resultados para el trigo (F1: 79.74%) y la combinación C + T (ID 12) resultó la más idónea para separar la cebada (F1: 84.94%). De esto último se desprende que la combinación de imágenes de coherencia, textura y retrodispersión mejoran la precisión de la clasificación. Asimismo, tales resultados corroboran que los datos ópticos pueden ser reemplazados por imágenes Sentinel-1A cuando las escenas de los primeros se vean limitadas por la presencia de nubes.
La clasificación utilizando imágenes ópticas (ID 4 - apilado de imágenes de NDVI) obtuvo óptimos resultados empleando el método MLC (P: 80.62%). En cambio, para la discriminación de cultivos de invierno, los valores más elevados de F1 se obtuvieron aplicando el método RF (82.95% para trigo y 84.16% para cebada).
Los mejores resultados de todas las clasificaciones llevadas a cabo se obtuvieron al combinar imágenes ópticas y SAR. En tal sentido, la combinación de todas las imágenes SAR (VV + VH + C+ T) con el apilado de NDVI (ID 14) arrojó los máximos valores de Precisión Global (89.37%).
En el caso particular de la discriminación de cultivos de invierno, también la combinación de datos Sentinel-1A con datos ópticos resultó la más precisa. Para la cebada, la combinación VV + VH + C+T+ NDVI (ID 14) obtuvo valores de F1 de 87.27% para el trigo y de 89.20% para la cebada empleando el algoritmo RF.