1. Introducción
Las imágenes son utilizadas en diversas áreas, una de ellas es el área de la medicina, que utiliza una gran variedad de estudios por imágenes como lo son los estudios de resonancia magnética. Sin embargo, la calidad de las imágenes puede verse afectada por muchos factores. Estas afectaciones dificultan el análisis o cualquier otro proceso que se requiera realizar con la imagen. La calidad de una imagen es descrita por las siguientes características: nitidez, contraste, color, claridad y artefactos [1].
La mala luminosidad es un claro ejemplo de los factores que afecta a la imagen, ésta generalmente afecta el contraste y la claridad de la imagen, ya que presentan acumulaciones de pixeles con niveles altos o bajos. Actualmente existen una gran variedad de técnicas que tratan este problema; uno de los más utilizados es la Ecualización del Histograma (EH), por su fácil implementación y buenos resultados. El histograma de una imagen es una función discreta que representa el número de pixeles en la imagen en función al nivel de intensidad [2]. El objetivo de la Ecualización del Histograma es distribuir de forma uniforme el valor que toma cada uno de los pixeles a lo largo del rango dinámico, obteniendo como resultado una imagen con mejor contraste.
Otra técnica tradicional utilizada es Power-Law Transform (PLT) [3], siendo una técnica rápida y sencilla, sin embargo, siguen surgiendo nuevas técnicas y variaciones de las mismas, tal es el caso de Contrast Limited Adaptive Histogram Equalization (CLAHE), siendo una variación de EH, usado en [4], para mejorar imágenes submarinas. A pesar de la existencia de diferentes técnicas para abordar este problema, se siguen investigando y desarrollando nuevas, ya que existen diferentes problemáticas a resolver como lo es la definición de las imágenes, siendo éste un factor a considerar en la calidad de una imagen; se requiere mayor resolución para obtener la mejor calidad posible. Actualmente existen distintos formatos y resolución [5]. Estas nuevas resoluciones aumentan el tamaño de las imágenes y con ello su tiempo de procesamiento, por lo que existe la necesidad de procesar en un tiempo aceptable toda esta información en la imagen que tiende a ir en aumento. Esto exige nuevas técnicas capaces de procesar la mayor cantidad de información en el menor tiempo posible y obteniendo buenos resultados.
En este sentido, otras técnicas no tradicionales utilizadas en el procesamiento de imágenes son las Redes Neuronales Artificiales (RNA's), que han entregado buenos resultados [6]. Las Redes Neuronales Pulso-Acopladas (Pulse-Coupled Neural Network PCNN) son una técnica que se ha utilizado en el área de Visión Artificial; este paradigma se basa en gran medida en el modelo de Eckhorn, que parte de la frecuencia de activación de las neuronas de la corteza visual [7].
Esto les permite cumplir de cierto modo algunas características visuales humanas [8], a diferencia de otras técnicas más matemáticas que pueden encontrarse en [9]. Del modelo PCNN surgen otras variantes como lo es el Modelo de Intersección Cortical (Intersection Cortical Model ICM) que es una versión más simple y está especialmente diseñado para el procesamiento de imágenes. Fue presentado como una herramienta para el procesamiento de imágenes que es computacionalmente más rápido que el modelo PCNN completo.
La característica de la auto-onda le permite procesar una vecindad de pixeles de manera más cercana a como lo hace la visión biológica. Algunas de sus aplicaciones han sido en la detección de objetos [10], la detección de ruido aditivo y gaussiano [11] y la detección de bordes [12]. Este modelo al igual que el modelo de la PCNN entrega imágenes binarias que poseen meta-información de la imagen y que puede ser utilizada para mejorarla. La introducción de la Matriz de Tiempo en un modelo de red neuronal pulsante se ha utilizado para mejorar distintas características de la imagen como se muestra en [11,12], ya que ésta da información sobre el tiempo de disparo de las neuronas, obteniendo así información adicional de la imagen.
En este trabajo se emplea la Matriz de Tiempo para obtener información de la intensidad de los pixeles y zonas en la imagen, logrando así modificar los valores de la imagen. Con esta información se alcanza una mejor distribución a lo largo del rango dinámico sin perder zonas de interés y evitando introducir ruido a la imagen, logrando de esta forma una imagen con un mejor contraste y luminosidad. Por otra parte, se presenta una configuración en los parámetros del modelo ICM para obtener un mejor desempeño con la Matriz de Tiempo, así mismo, se presenta una modificación en la matriz de pesos para reducir la propagación de la auto-onda. Finalmente se presentan los diferentes resultados obtenidos con dos modelos propuestos basados en ICM con algunas variaciones en la normalización y pesos.
En la Sección 2 se presenta el modelo utilizado y la Matriz de Tiempo, en la Sección 3 se describen los algoritmos propuestos, en la Sección 4 se presenta la experimentación y resultados obtenidos, se describen las métricas de evaluación utilizadas y se muestran los resultados de la evaluación de los experimentos, en la Sección 5 se presenta una discusión y finalmente las conclusiones y trabajo futuro es mencionado en la Sección 6.
2. Modelo de Intersección Cortical (ICM)
El modelo neuronal ICM minimiza el costo del cálculo, manteniendo a la vez la efectividad del modelo cortical cuando se aplica a imágenes. Se basa en los elementos comunes de varios modelos biológicos [13]. Es un modelo simplificado del modelo PCNN, siendo la ICM un caso especial de la PCNN en la cual no hay neuronas de enlace (linking). La ICM sólo utiliza entradas de alimentación (feeding). Es decir, si la fuerza de enlace de la PCNN se establece en ceros, se convertirá en la ICM. En la Fig. 1, se muestra el diagrama de la ICM.
La señal Fij se obtiene mediante el producto del parámetro f y la señal Fij dada en un estado anterior; más la ponderación de la última salida del vecindario de neuronas Ykl por una matriz wijkl y por el estímulo externo de entrada Sij. El umbral dinámico Tij crece obedeciendo a h cuando su salida se activa y mantiene su estado previo con una atenuación dada por g, lo cual da origen a la formación de pulsos. El modelo ICM se describe con las ecuaciones (1, 2, 3):
donde n es la iteración actual, w es la matriz de pesos sinápticos generalmente gaussiana de 3 × 3 como se muestra en la ecuación (4), que liga una neurona con sus vecinas y finalmente f,g y h son coeficientes de ajuste, donde g < 1.0 , f < g y h un valor cercano a 20:
La Matriz de Tiempo (MT) se define para registrar la iteración o tiempo de activación para todas las neuronas Yij Fig. 2. Si la neurona se dispara se registrará el tiempo en que se disparó [8]. Por tanto, un pequeño valor en la Matriz de Tiempo indica que el píxel correspondiente tiene una alta intensidad, y pertenece a una región más brillante. De modo contrario, un gran valor indica que el píxel correspondiente tiene una intensidad baja y pertenece a una región más oscura. La Matriz de Tiempo se define en la ecuación (5):
3. Algoritmos Neuronales Propuestos
3.1. ICM-LTM
El proceso del algoritmo propuesto que llamamos Modelo de Intersección Cortical con Matriz de Tiempo Luminosa (Intersection Cortical Model - Luminance Time Matrix ICM-LTM) es similar a ICM, sólo que se anexa la Matriz de Tiempo donde se registrará el número de iteración n de activación de cada una de las neuronas de salida Yij. El proceso del algoritmo se muestra en la Fig. 3.
Los seis pasos del algoritmo ICM-LTM se describen a continuación con un ejemplo de caso de imagen oscura.
Paso 1. El proceso del algoritmo inicia estableciendo los parámetros de la ICM, f,g y h, del mismo modo se inicializan las matrices Fij, Yij, Tij y Sij, donde Sij se inicializa con los valores de la imagen de entrada normalizados, con respecto al valor máximo que puede tomar el pixel, en este caso al utilizar imágenes de 8 bits (255). Es decir, su valor original dividido entre 255, obteniendo así una matriz con valores entre cero y uno como se muestra en la Fig. 4.
Paso 2. El proceso para obtener la Matriz de Tiempo Mij es mostrado en la Fig. 5. Cuando la salida Yij de la ICM es activada por primera vez se registra en la MT la iteración de activación.
La ICM itera hasta conseguir que se disparen todas las neuronas. Esto da como resultado una MT con valores entre uno y el número de iteraciones requeridas para activar todas las neuronas (11 en este ejemplo), donde uno corresponde a las neuronas que se dispararon en la primera iteración y 11 corresponden a las últimas neuronas en activarse.
Las primeras neuronas en activarse corresponden a los pixeles más luminosos y las últimas corresponden a los pixeles más oscuros. Paso 3. Una vez obtenida la MT se normaliza; la normalización se realiza con una división entre el valor en la MT y las iteraciones requeridas, restándole a ambas partes la primera época de activación; de esta forma la MT normalizada (MTN) queda con valores entre cero y uno (Fig. 6); en este caso el número de iteraciones realizadas fue 11, y la primera neurona se disparó en la época 1; en caso de trabajar con imágenes oscuras se modifica el valor restando uno al valor de la MT normalizada (Fig. 7), logrando así realizar el funcionamiento contrario.
Paso 4. Posteriormente, los valores de la Matriz de Tiempo normalizados se multiplican por un peso w inicialmente de 0.1 para todos los pixeles con la finalidad de no modificar demasiado los valores de la imagen de entrada, obteniendo una Matriz de Tiempo ponderada (MTP) como se muestra en la Fig. 8.
Paso 5. El valor obtenido de esta multiplicación se utiliza para disminuir los valores de los pixeles de la imagen de entrada normalizada, en el caso de las imágenes luminosas, o incrementar en caso de las imágenes oscuras, es decir, a la matriz Sij se le resta o suma la MT ponderada, obteniendo como resultado el nuevo valor normalizado del píxel, la Fig. 9 muestra el resultado de una imagen oscura.
El proceso de obtención de la Matriz Ponderada se repite modificando el valor del peso w hasta conseguir que por lo menos el valor de un píxel llegue al valor deseado, en este caso al ser una imagen oscura que cuenta con valores en cero se busca el uno (Fig. 10). Esto es con la finalidad de abarcar todo el rango dinámico de la imagen, siendo uno equivalente a 255 al des-normalizar.
Paso 6. Finalmente, el valor obtenido como resultado se des-normaliza multiplicándolo por: 255, dando como resultado la imagen mejorada final (Fig. 11). La comparación de la imagen mejorada y la resultante de este ejemplo es mostrada en la Fig. 12.
3.2. ICM-LTM2
El algoritmo que llamamos ICM-LTM2 es una modificación al algoritmo ICM-LTM, esto con la finalidad de mejorar en tiempo y resultados. Se realizaron tres modificaciones, dos en el Paso uno, específicamente en la matriz de pesos de la ICM y la normalización de la imagen de entrada y una modificación más en el Paso 4, donde se eliminaron las iteraciones para encontrar el peso adecuado. El diagrama de flujo que sigue el algoritmo se presenta en la Fig. 13, donde
La primera modificación se realizó en la matriz de pesos, estableciendo la matriz de pesos como se muestra en la ecuación (6), esto con el fin de reducir la onda expansiva de la ICM, ya que esto provocaba un destello en los bordes lo que afecta su calidad:
La segunda modificación se emplea en la normalización de la imagen de entrada normalizándola de acuerdo al rango dinámico de la imagen, es decir de acuerdo con el valor máximo escala de 0 a 255, logrando así reducir el tiempo requerido para obtener la MT.
Finalmente se calculó directamente el peso w requerido, estableciéndolo igual al valor mínimo en la imagen de entrada para imágenes luminosas y como la diferencia entre uno y el valor máximo de la imagen de entrada para imágenes oscuras.
Esto se realizó ya que el valor máximo que toma la MT ponderada es igual a uno y esto afectará más a los valores máximos para obtener un 255 a la salida en imágenes oscuras, o a los mínimos para obtener un cero en la salida en imágenes luminosas según sea el caso. Logrando de esta manera eliminar las iteraciones realizadas para encontrarlo y con ello reducir el tiempo de procesamiento. El resultado del mismo ejemplo de caso de imagen oscura procesado con ICM-LTM2 es mostrado en la Fig. 14.
4. Experimentación y resultados
Para la experimentación se tomaron tres estudios de resonancia magnética con 150 imágenes cada uno en tres modalidades: PD, T1 y T2, simuladas en BrainWeb[14-16]. Estas imágenes fueron desplazadas utilizando la técnica de desplazamiento del histograma (DH) [2], en: 20, 40, 60, 80, 100, 120 y 140 del valor cromático del pixel, tanto positivo como negativo, obteniendo así un total de 6,300 imágenes para la experimentación. Se establecieron los valores de Mij, Yij y Fij, en cero, del tamaño de las imágenes de experimentación.
La matriz Tij y se inicializó en 1, del mismo tamaño que las imágenes de entrada. El parámetro f se estableció en 0.1, g en 0.9 y h en 20 tanto para ICM-LTM como para ICM-LTM2. Los parámetros fueron seleccionados de experimentaciones previas considerando la información que entregaba cada iteración de la ICM con respecto a la intensidad de los pixeles, el tiempo y distribución de los valores de la Matriz de Tiempo. La experimentación y los resultados se dividieron en tres etapas: la etapa 1), donde se realizaron las experimentaciones con imágenes en modalidad PD; la etapa 2), donde se realizaron las experimentaciones con la modalidad T1; y finalmente la etapa 3), donde se experimentó con imágenes en modalidad T2.
4.1. Métricas
Los métodos utilizados para el mejoramiento de la imagen dependen generalmente de las necesidades especiales para algunas aplicaciones.
En la mayoría de los casos, los efectos de mejora son evaluados por la percepción visual, difícilmente se llegan a evaluar de forma objetiva por medio de una métrica, a pesar de ello, existen diferentes métricas para evaluar la calidad de una imagen tomando en cuenta nitidez, contraste, color, claridad y artefactos.
Se han usado diferentes modelos multidimensionales para evaluar la calidad a partir de las medidas obtenidas sobre los atributos; la calidad en este tipo de modelos se puede aproximar como una función que calcula la distancia euclídea de las imágenes degradadas con respecto a una imagen ideal en un espacio n dimensional, como se muestra en la ecuación (7), [17]:
donde la calidad C es entendida como la distancia euclidiana entre una imagen digital x y su imagen referente ideal y, a partir de sus atributos i, ponderados mediante sus coeficientes de ponderación p. Otro método utilizado es la Métrica de Similitud Estructural (SSIM) que se usa para medir la similitud entre dos imágenes considerando la luminancia, contraste y estructura, combinando las tres y simplificando se obtiene la ecuación (8) [18]. Es una métrica de referencia completa por lo que toma una imagen de referencia siendo ésta la imagen sin distorsionar:
donde
4.2. Modalidad PD
Se iniciaron los experimentos con imágenes médicas en la modalidad PD, comenzando con las imágenes luminosas; se aplicaron los 7 desplazamientos antes mencionados de forma positiva en las 150 imágenes del estudio.
Las imágenes fueron procesadas por los algoritmos: ICM-LTM, ICM-LTM2, EH [2], PLT[3], CLAHE[4]. Uno de los resultados obtenidos en esta experimentación se muestra en la Fig. 15, donde se observa que las imágenes obtenidas por los modelos propuestos visualmente se asemejan más a la imagen original, al igual que CLAHE, sin embargo, a pesar de entregar un buen contraste este presenta más ruido en la imagen resultante.
Así mismo, se presenta uno de los resultados obtenidos en imágenes oscuras con desplazamiento de -120 (Fig. 16), donde se puede observar que la pérdida de información de las imágenes desplazada es menor a pesar del valor de desplazamiento ya que los estudios PD resultan ser más luminosos, por ello se obtuvieron mejores resultados con todos los algoritmos, sin embargo, PLT y CLAHE a pesar de entregar un muy buen resultado en términos del contraste introducen ruido a la imagen lo que afecta a la hora de compararla con la imagen original.
Las técnicas propuestas introducen un destello en los bordes de la imagen, a pesar de ello no introducen otro tipo de ruido y afecta principalmente al fondo que no posee información relevante. ICM-LTM2 reduce este destello como se esperaba al modificar su matriz de pesos.
4.3. Modalidad T1
Se continuó con los experimentos en modalidad T1, iniciando con las imágenes luminosas, donde se obtuvieron resultados como los mostrados en la Fig. 17.
Donde se puede observar que todas las técnicas entregan buenos resultados a excepción de PLT, sin embargo, cabe mencionar que las técnicas de EH y CLAHE, no logran reducir tanto el brillo de la imagen como las técnicas propuestas ICM-LTM e ICM-LTM2. Para la experimentación con imágenes oscuras en modalidad T1 se obtuvieron resultados como los mostrados en la Fig. 18, donde se muestra una de las imágenes con desplazamiento de -80.
El resultado mostró que las imágenes obtenidas con los algoritmos propuestos son muy similares a la imagen original y presentan menos ruido que las otras técnicas a pesar de no presentar tanto contraste como PLT y CLAHE.
4.4. Modalidad T2
Finalmente se obtuvieron los resultados de las imágenes luminosas, al igual que imágenes oscuras del estudio en modalidad T2. El resultado de una de las imágenes con desplazamiento de +80 presenta que los algoritmos propuestos son más brillantes que la imagen original, sin embargo, el contraste en la imagen aparentemente es mejor y el ruido es menor que en las otras técnicas. Fig. 19.
Los resultados obtenidos con las imágenes oscuras del estudio T2 se muestra en la Fig. 20. Donde se observa que los algoritmos propuestos visualmente entregan mejores resultados, ya que se encuentran más detalles que no se presentan con las otras técnicas, y los resultados son más semejantes a la imagen original; así mismo, el algoritmo ICM-LTM2 introduce menos ruido a la imagen que el resto de las técnicas.
4.5.1. Modalidad PD
Se inició con la evaluación de los resultados de la primera etapa donde se experimentó con las imágenes en modalidad PD. Se inició con el caso luminoso con la métrica C que se muestra en la Tabla 1 y con SSIM en la Tabla 2. Del mismo modo se continúo con el caso oscuro con ambas métricas en la Tabla 3 y 4 respectivamente.
DH | ICM-LTM | ICM-LTM2 | EH | PLT | CLAHE |
---|---|---|---|---|---|
+20 | 0.05 | 0.05 | 0.21 | 0.15 | 0.13 |
+40 | 0.10 | 0.10 | 0.27 | 0.22 | 0.12 |
+60 | 0.13 | 0.14 | 0.29 | 0.32 | 0.18 |
+80 | 0.14 | 0.16 | 0.33 | 0.40 | 0.25 |
+100 | 0.13 | 0.17 | 0.34 | 0.47 | 0.28 |
+120 | 0.12 | 0.17 | 0.33 | 0.52 | 0.32 |
+140 | 0.11 | 0.18 | 0.34 | 0.19 | 0.36 |
Prom. | 0.11 | 0.14 | 0.30 | 0.32 | 0.23 |
DH | ICM-LTM | ICM-LTM2 | EH | PLT | CLAHE |
---|---|---|---|---|---|
+20 | 0.75 | 0.34 | 0.08 | 0.09 | 0.12 |
+40 | 0.76 | 0.19 | 0.07 | 0.05 | 0.08 |
+60 | 0.54 | 0.09 | 0.06 | 0.03 | 0.06 |
+80 | 0.48 | 0.07 | 0.06 | 0.02 | 0.04 |
+100 | 0.53 | 0.10 | 0.06 | 0.01 | 0.03 |
+120 | 0.39 | 0.08 | 0.05 | 0.01 | 0.03 |
+140 | 0.48 | 0.06 | 0.05 | 0.11 | 0.02 |
Prom. | 0.56 | 0.13 | 0.06 | 0.05 | 0.05 |
DH | ICM-LTM | ICM-LTM2 | EH | PLT | CLAHE |
---|---|---|---|---|---|
-20 | 0.03 | 0.02 | 0.22 | 0.29 | 0.17 |
-40 | 0.05 | 0.04 | 0.23 | 0.40 | 0.19 |
-60 | 0.08 | 0.06 | 0.23 | 0.42 | 0.21 |
-80 | 0.11 | 0.08 | 0.24 | 0.40 | 0.24 |
-100 | 0.15 | 0.10 | 0.24 | 0.27 | 0.26 |
-120 | 0.18 | 0.12 | 0.24 | 0.18 | 0.29 |
-140 | 0.21 | 0.14 | 0.25 | 0.25 | 0.31 |
Prom. | 0.12 | 0.08 | 0.24 | 0.32 | 0.24 |
4.5.2. Modalidad T1
Los resultados de la evaluación de la segunda fase de experimentos, donde se trabaja con imagen en modalidad T1, se muestran en la Tabla 5 y 6 el caso luminoso con cada una de las métricas y en Tabla 7 y 8 el caso oscuro.
DH | ICM-LTM | ICM-LTM2 | EH | PLT | CLAHE |
---|---|---|---|---|---|
+20 | 0.04 | 0.03 | 0.30 | 0.32 | 0.18 |
+40 | 0.08 | 0.06 | 0.30 | 0.35 | 0.21 |
+60 | 0.12 | 0.10 | 0.30 | 0.40 | 0.24 |
+80 | 0.16 | 0.15 | 0.30 | 0.46 | 0.27 |
+100 | 0.21 | 0.20 | 0.30 | 0.52 | 0.30 |
+120 | 0.23 | 0.26 | 0.29 | 0.59 | 0.37 |
+140 | 0.23 | 0.32 | 0.29 | 0.33 | 0.44 |
Prom. | 0.15 | 0.16 | 0.30 | 0.42 | 0.29 |
DH | ICM-LTM | ICM-LTM2 | EH | PLT | CLAHE |
---|---|---|---|---|---|
+20 | 0.83 | 0.26 | 0.03 | 0.03 | 0.08 |
+40 | 0.80 | 0.20 | 0.03 | 0.01 | 0.04 |
+60 | 0.80 | 0.20 | 0.03 | 0.01 | 0.03 |
+80 | 0.59 | 0.19 | 0.03 | 0.01 | 0.02 |
+100 | 0.50 | 0.18 | 0.03 | 0.01 | 0.02 |
+120 | 0.74 | 0.16 | 0.03 | 0.01 | 0.02 |
+140 | 0.63 | 0.14 | 0.02 | 0.07 | 0.01 |
Prom. | 0.70 | 0.19 | 0.03 | 0.02 | 0.03 |
DH | ICM-LTM | ICM-LTM2 | EH | PLT | CLAHE |
---|---|---|---|---|---|
-20 | 0.04 | 0.03 | 0.32 | 0.23 | 0.12 |
-40 | 0.06 | 0.06 | 0.34 | 0.15 | 0.10 |
-60 | 0.09 | 0.08 | 0.37 | 0.12 | 0.10 |
-80 | 0.12 | 0.11 | 0.40 | 0.16 | 0.12 |
-100 | 0.16 | 0.14 | 0.44 | 0.22 | 0.17 |
-120 | 0.20 | 0.17 | 0.54 | 0.26 | 0.24 |
-140 | 0.24 | 0.21 | 0.60 | 0.29 | 0.28 |
Prom. | 0.13 | 0.11 | 0.43 | 0.20 | 0.16 |
4.5.3. Modalidad T2
En la evaluación realizada de la tercera etapa de experimentación, que se realizó con imágenes en T2, se obtuvieron los resultados que se muestran en la Tabla 9 y 10, en el caso luminoso y en el caso oscuro se muestran en la Tabla 11 y 12.
DH | ICM-LTM | ICM-LTM2 | EH | PLT | CLAHE |
---|---|---|---|---|---|
+20 | 0.04 | 0.03 | 0.44 | 0.25 | 0.11 |
+40 | 0.07 | 0.05 | 0.44 | 0.34 | 0.17 |
+60 | 0.10 | 0.08 | 0.44 | 0.43 | 0.23 |
+80 | 0.12 | 0.10 | 0.44 | 0.53 | 0.29 |
+100 | 0.13 | 0.13 | 0.45 | 0.65 | 0.35 |
+120 | 0.15 | 0.16 | 0.44 | 0.77 | 0.41 |
+140 | 0.16 | 0.20 | 0.44 | 0.22 | 0.47 |
Prom. | 0.11 | 0.11 | 0.44 | 0.46 | 0.29 |
DH | ICM-LTM | ICM-LTM2 | EH | PLT | CLAHE |
---|---|---|---|---|---|
+20 | 0.75 | 0.33 | 0.08 | 0.04 | 0.12 |
+40 | 0.80 | 0.21 | 0.08 | 0.02 | 0.08 |
+60 | 0.63 | 0.12 | 0.07 | 0.02 | 0.06 |
+80 | 0.65 | 0.06 | 0.07 | 0.02 | 0.04 |
+100 | 0.70 | 0.11 | 0.06 | 0.02 | 0.04 |
+120 | 0.51 | 0.12 | 0.06 | 0.01 | 0.03 |
+140 | 0.62 | 0.07 | 0.06 | 0.12 | 0.02 |
Prom. | 0.67 | 0.15 | 0.07 | 0.04 | 0.06 |
DH | ICM-LTM | ICM-LTM2 | EH | PLT | CLAHE |
---|---|---|---|---|---|
-20 | 0.04 | 0.04 | 0.55 | 0.17 | 0.05 |
-40 | 0.07 | 0.05 | 0.56 | 0.17 | 0.05 |
-60 | 0.11 | 0.10 | 0.57 | 0.19 | 0.06 |
-80 | 0.15 | 0.15 | 0.61 | 0.21 | 0.11 |
-100 | 0.20 | 0.16 | 0.64 | 0.22 | 0.15 |
-120 | 0.24 | 0.20 | 0.65 | 0.18 | 0.18 |
-140 | 0.26 | 0.23 | 0.67 | 0.19 | 0.20 |
Prom. | 0.15 | 0.13 | 0.61 | 0.19 | 0.11 |
4.5.4. Evaluación general
Finalmente se realizó la evaluación general que considera los tres estudios en conjunto para cada deslazamiento con las dos métricas utilizadas, C mostrada en la Tabla 13 y SSIM en la Tabla 14. Sus respectivas gráficas son mostradas en la Fig. 21 y 22.
DH | ICM-LTM | ICM-LTM2 | EH | PLT | CLAHE |
---|---|---|---|---|---|
20 | 0.04 | 0.03 | 0.34 | 0.23 | 0.13 |
40 | 0.07 | 0.06 | 0.36 | 0.27 | 0.14 |
60 | 0.11 | 0.09 | 0.37 | 0.31 | 0.17 |
80 | 0.14 | 0.13 | 0.39 | 0.36 | 0.21 |
100 | 0.16 | 0.15 | 0.40 | 0.39 | 0.25 |
120 | 0.19 | 0.18 | 0.42 | 0.42 | 0.30 |
140 | 0.20 | 0.21 | 0.43 | 0.25 | 0.35 |
Prom. | 0.13 | 0.12 | 0.39 | 0.32 | 0.22 |
DH | ICM-LTM | ICM-LTM2 | EH | PLT | CLAHE |
---|---|---|---|---|---|
20 | 0.71 | 0.55 | 0.06 | 0.28 | 0.34 |
40 | 0.60 | 0.44 | 0.05 | 0.28 | 0.32 |
60 | 0.47 | 0.36 | 0.05 | 0.24 | 0.31 |
80 | 0.38 | 0.30 | 0.04 | 0.24 | 0.30 |
100 | 0.35 | 0.27 | 0.04 | 0.26 | 0.28 |
120 | 0.31 | 0.23 | 0.04 | 0.29 | 0.26 |
140 | 0.31 | 0.19 | 0.03 | 0.33 | 0.25 |
Prom. | 0.45 | 0.33 | 0.04 | 0.27 | 0.29 |
5. Discusión
Los resultados generales muestran que las técnicas propuestas ICM-LTM e ICM-LTM2 presentan mejores resultados con las métricas C y SSIM que las técnicas tradicionales; sólo en algunos casos excepcionales resultó que la técnica PLT y CLAHE muestran mejores resultandos siendo éstos normalmente en imágenes muy afectadas, con desplazamientos entre 120 y 140 del valor cromático del pixel.
En general podría decirse que el algoritmo ICM-LTM entrega mejores resultados, sin embargo, el aspecto visual parece favorecer a el algoritmo ICM-LTM2 ya que por la reducción de la auto-onda al modificar la Matriz de Pesos reduce los destellos de luz en los bordes, esto podría ayudar a la hora de procesar las imágenes ya que este destello podría afectar en el procesamiento; aunado a eso, la normalización de la imagen de entrada que nos permite llenar más rápido la Matriz de Tiempo y el cálculo del peso w sin realizar las iteraciones para buscarlo permite disminuir el tiempo de procesamiento.
Por otro lado, la disminución importante en el tiempo de procesamiento se logrará cuando se tenga la implementación en paralelo de los algoritmos propuestos. Se estima una reducción en el tiempo de procesamiento del orden de aproximadamente n unidades siendo este el número de núcleos utilizados ya que su naturaleza permite paralelizar más del 90% del proceso.
6. Conclusiones y trabajo futuro
Se obtuvo en promedio un 10% de mejora con la métrica C y un 4% de mejora con SSIM; esto en comparación con CLAHE, siendo esta la técnica que entregó mejores resultados en promedio. Se observó que las técnicas entregan un mejor desempeño en imágenes luminosas que en imágenes oscuras lo que podría deberse a las modificaciones realizadas para tratar con ellas. La modificación realizada en ICM-LTM2 ayudó a obtener los resultados en menor tiempo hasta en un 25% más rápido y entregar mejores resultados con respecto a la métrica C.
Como trabajo futuro podrían optimizarse los parámetros de la ICM al igual que la Matriz de Pesos w, ya que han sido establecidas de acuerdo a las propuestas en la literatura y experimentaciones realizadas a prueba y error. Así mismo, realizar experimentos estableciendo el valor deseado mínimo y máximo del pixel de acuerdo al tipo de estudio, ya que el exceso de brillo o falta de él, podría deberse a que la imagen naturalmente no toma valores en 0 o 255; del mismo modo, la implementación del algoritmo en paralelo para aprovechar las ventajas que presenta su naturaleza paralela, estimándose ahorros en tiempo en aproximadamente n unidades siendo este igual al número de núcleos utilizados y menor o igual al número de pixeles en la imagen a procesar. También realizar pruebas para ver el impacto de la mejora de las imágenes en una aplicación de clasificación de imágenes.