Introducción
La retinopatía diabética es considerada la principal causa de pérdida visual no recuperable en los países industrializados. Prevalece en pacientes con edades entre 20 y 64 años y es responsable del 10 % de los nuevos casos de ceguera cada año (Teus, Arranz-Márquez, López-Guajardo y Jiménez-Parras, 2007; Tenorio y Ramírez-Sánchez, 2010). A nivel mundial, la Organización Mundial de la Salud (OMS) reportó un total de 422 000 000 de casos de diabéticos en el año 2014, con una prevalencia de 8.5 % mundial y una tendencia creciente en países en vías de desarrollo, por lo que se estima que esta enfermedad se incrementará en los próximos años de manera exponencial (Teus, Arranz-Márquez, López-Guajardo y Jiménez-Parras, 2007; World Health Organization, 2016). Además, el Centro de Control de Enfermedades y Prevención de los Estados Unidos de América (CDC) reportó que hasta 2018 se estimaba que 26 900 000 personas de todas las edades estaban diagnosticadas con diabetes mellitus (Centers for Disease Control and Prevention, 2020). Esta cifra representa el 12.2 % de la población adulta. Por otro lado, el 34.5 % de la población adulta se encuentra en un estatus de prediabetes (Ghanchi et al., 2017, p. 13; Gupta et al., 2016, p. 2402).
En México, la prevalencia de Diabetes Mellitus tipo 2 (DM2) en mayores de 20 años aumentó de 6.7 % en 1993 a 7.5 % en 2000, y se calcula que podrá llegar a 12.3 % (11 700 000 personas) para el año 2025 (Cervantes et al., 2014, p. 511).
La prevalencia informada de la retinopatía diabética en mexicanos es de entre 42 y 50 %, superior a la informada en mexicoamericanos (33 %) y en blancos no hispanos (18 a 29 %) (Ghanchi, Bailey y Chakravarthy, 2013). Se ha publicado que la incidencia de la retinopatía diabética en México a tres años es de 23 %, y de 47.6 % a seis años (Shah et al., 2018). La progresión de un grado de retinopatía diabética a uno más avanzado se ha informado de 21 y 70 % a cuatro y seis años, respectivamente (Tenorio y Ramírez-Sánchez, 2010).
La prueba de tamizaje es de gran relevancia para el diagnóstico de diferentes enfermedades en oftalmología, en especial aquellos padecimientos secundarios a enfermedades crónico- degenerativas. Por ello, es crucial que el tamizaje sea rápido, eficaz, práctico y económico.
En el trabajo de Oloumi et al. (2012, 2013) se propuso un método que diagnostica la retinopatía diabética de forma asistida por computadora, mediante la medición cuantitativa de los cambios en la apertura de la arcada temporal principal (MTA), los cuales ocurren comúnmente debido a la retinopatía diabética proliferativa (RDP). El método consiste en el modelado sencillo y doble parabólico de la MTA y de sus componentes (arcada temporal inferior [ITA] y arcada temporal superior [STA]), así como en la medición de ángulos de la arcada y las diferencias entre el valor absoluto de los parámetros de apertura de la MTA y la ITA (Oloumi, Rangayyan y Ells, 2012; Oloumi, Rangayyan y Ells, 2013). El estudio mostró diferencias altamente significativas de los casos de pacientes en comparación con los casos de pacientes con RDP. De manera similar, hubo diferencias muy significativas entre las medidas de ángulo para los casos normales en comparación con los casos de RDP. El bajo promedio obtenido para el valor absoluto del parámetro de apertura de los modelos STA para los casos normales pueden ser debido a la naturaleza de la vasculatura retiniana (Owens et al., 1998; Cruz-Aceves, Guerrero-Turrubiates y Sierra-Hernández, 2017).
Giacinti et al. (2019) propusieron un método novedoso para la medición automática de las venas temporales superiores e inferiores en fondo de ojo (Giacinti, Cervantes Sánchez, Cruz Aceves, Hernández González y López Montero, 2019). En una primera etapa, se realizó la segmentación de estructuras de tipo arterial, obteniendo un valor de 0.9618 en la métrica Accuracy. Posteriormente, se construyó un modelado parabólico de las venas temporales superiores e inferior. Con base en los resultados de Accuracy y en el tiempo computacional, el método propuesto se consideró como alternativa para diagnóstico y tamizaje por método computacional.
En el presente trabajo se propone la determinación de la arcada temporal mayor de la vasculatura de la retina mediante un algoritmo de modelación numérica que pueda asistir al médico experto en el diagnóstico, la toma de decisiones y el seguimiento de la evolución de la patología del paciente, ayudando a pronosticar o anticipar futuras afectaciones que podrían derivar en una enfermedad severa. Además, se pretende acortar el periodo de acceso a la valoración mediante la detección automática e inmediata de alteraciones mayores, sin que ello requiera la intervención de personal experto, optimizando de este modo la consulta de oftalmología.
Método
Imágenes de fondo de ojo
Una vez que el proyecto fue aprobado por el Comité de Ética y por el Comité de Investigación de la Unidad Médica de Alta Especialidad HE 1 CMN Bajío, con número de registro R-2020-1001-128, se solicitó autorización a voluntarios sanos, adultos de ambos géneros, para tomar imágenes de fondo de ojo. Los participantes en el estudio firmaron el consentimiento informado y todas las imágenes fueron tomadas bajo la supervisión de los autores.
Se determinó que las imágenes a considerar dentro del estudio debían cumplir con un conjunto de condiciones que aseguraran una calidad suficiente para realizar el estudio. Los criterios considerados fueron los siguientes: 1) las imágenes debían capturar completamente el trayecto de la vasculatura retiniana temporal superior e inferior; 2) estar adecuadamente iluminadas, y 3) estar suficientemente nítidas, según el criterio de los especialistas. Los casos en los que se detectó alguna alteración en la vasculatura, mácula, fóvea o disco óptico, también fueron incluidos dentro de la base de datos, debido a que el futuro del protocolo es crear un método de escrutinio. Los criterios de no inclusión fueron imágenes de pacientes con enfermedades crónico-degenerativas -como diabetes mellitus e hipertensión arterial sistémica- así como imágenes de mala calidad que cortaban la trayectoria de los vasos sanguíneos y el disco óptico central.
Como parte de las buenas prácticas en la investigación clínica fueron incluidos en el estudio y, además, recibieron cita en oftalmología para seguimiento aquellos pacientes que presentaron patología oftalmológica sin tener conocimiento previo del padecimiento.
Las imágenes, en total 136 fotografías de
Segmentación binaria de estructura vascular
El problema de segmentación automática de estructuras arteriales consiste en extraer, a partir de una imagen, estructuras arteriales de diferentes amplitudes, longitudes y orientaciones, sin importar la anatomía o las relaciones entre ellas.
En la literatura, este problema ha sido abordado de forma exhaustiva, típicamente dividiendo la tarea en dos etapas: mejora de imagen y segmentación. En la etapa de mejora de imagen se suelen emplear todo tipo de filtros espaciales o frecuenciales, de tal forma que los filtros sean capaces de realzar las estructuras arteriales con respecto al fondo de la imagen, a la vez que hacen más homogénea la iluminación. Esta etapa entrega como salida una respuesta del filtro en niveles de gris, por lo que debe realizarse una etapa de segmentación para definir las clases (pixeles arteriales y pixeles de fondo) a las que pertenece cada píxel de imagen.
La etapa de segmentación suele utilizar algoritmos automáticos de umbralización global para definir el valor de umbral que es capaz de discriminar entre ambas clases de la imagen filtrada en la etapa de detección (Mapayi, Viriri y Tapamo, 2015; BahadarKhan, A-Khaliq y Shahid, 2016).
En el presente trabajo, la fase de mejora de imagen se lleva a cabo mediante el uso de Filtros Gaussianos de Correspondencia (Chaudhuri, Chatterjee, Katz, Nelson y Goldbaum, 1989; Cruz-Aceves, Cervantes-Sánchez y Ávila-García, 2018), debido a los pocos parámetros de ajuste y a la eficiencia en capturar las venas de temporales, que son las de mayor amplitud y longitud a lo largo de la imagen de entrada.
Los Filtros Gaussianos de Correspondencia son especialmente útiles para detectar estructuras de tipo arterial en diferentes tipos de imágenes, mediante el empleo de una función Gaussiana predefinida que trata de aproximar estructuras lineales en el dominio espacial con una intensidad diferente al fondo. El método GMF está definido mediante la siguiente expresión:
Donde: L representa la longitud del segmento con el que se trabajará en pixeles y la variable sigma representa el ancho arterial a ser detectado. Para detectar estructuras arteriales a diferentes grados de orientación, la función Gaussiana
Dado que el interés de esta investigación es la detección de la Arcada Temporal Mayor y no la totalidad de las estructuras arteriales en la imagen, los parámetros del método GMF fueron ajustados de forma experimental a los siguientes valores:
Para evaluar la eficiencia del método de segmentación, se utilizó la métrica Accuracy, que se refiere a la proporción de pixeles correctamente etiquetados, tanto positivos (pertenecientes a la estructura vascular) como negativos (pertenecientes al fondo de la imagen), sobre el conjunto total de pixeles examinados, es decir:
Donde: TP corresponde a la cantidad de verdaderos positivos, TN corresponde a la cantidad de verdaderos negativos, FP corresponde a la cantidad de falsos positivos y FN corresponde a la cantidad de falsos negativos. Un valor de ACC de 1 corresponde a un desempeño perfecto, mientras que un valor de 0 corresponde al peor desempeño.
Modelado numérico de la MTA
La segunda fase del método propuesto consiste en realizar el modelado numérico de las venas temporales, tomando como imagen de entrada la imagen binarizada obtenida en la fase de segmentación.
A diferencia del problema de segmentación, el problema de modelado ha sido abordado en sólo cuatro trabajos en la literatura (Oloumi, Rangayyan y Ells, 2012; Oloumi, Rangayyan y Ells, 2013; Cruz-Aceves, Guerrero-Turrubiates y Sierra-Hernández, 2017; Valdez, Espinoza-Pérez, Cervantes-Sánchez y Cruz-Aceves, 2018). En estos trabajos, el problema de modelado se ha realizado en dos grandes fases: la fase de preprocesamiento, incluyendo la detección y segmentación automática de arterias, y la fase de modelado numérico de las venas temporales mediante algoritmos basados en parametrización parabólica, en algunos casos utilizando la Transformada de Hough.
En este trabajo se propone utilizar curvas Splines de segundo grado para modelar las arcadas
temporales superior e inferior. Las curvas Splines son funciones polinómicas
definidas a trozos que tienen la capacidad de modelar curvas con formas
complejas, evitando oscilaciones abruptas en su aproximación (Schumaker, 2007). Considerando un conjunto
de
Donde: cada segmento
La cuantificación del resultado del modelado numérico con respecto a la delineación realizada por expertos se llevó a cabo mediante la métrica de la distancia media al punto más cercano (Mean Distance to the Closest Point, MDCP). Esta métrica calcula el promedio de las distancias de cada punto perteneciente al modelo computacional con respecto al punto más cercano del modelo delineado. Esta distancia puede ser definida como se presenta a continuación:
Donde: N representa la cardinalidad del conjunto modelado y DCP representa la medida de distancia, la cual en el presente problema es la distancia Euclidiana. MDCP es una medida de distancia que no dispone de una cota superior, sin embargo, mientras más cercano a cero sea su valor, más parecidos serán los conjuntos de puntos en evaluación.
Resultados
En esta sección se presenta una descripción detallada de las características de las imágenes que conforman la base de datos elaborada en este estudio, así como las comparaciones de desempeño de las dos fases del método propuesto, segmentación y modelado numérico.
Los experimentos computacionales se desempeñaron en una computadora Intel Core i3, con un procesador de 2.13 GHz y 4 GB de memoria RAM. El software utilizado fue desarrollado en el lenguaje de programación Python versión 3.7.3.
Imágenes de fondo de ojo
La base de datos elaborada para en el presente trabajo consta de 136 imágenes de fondo de ojo, capturadas mediante una Cámara Topcon Medical Systems, Versión TRC-50Dx. Las imágenes fueron tomadas a 68 pacientes, distribuidos en 58 % de sexo masculino y 42 % de sexo femenino, con una edad promedio de 29 años. Las imágenes fueron tomadas a pacientes sanos, bajo previo consentimiento informado. Se descartaron todos aquellos pacientes de los que se conociera alguna enfermedad crónico-degenerativa.
Con el objetivo de cuantificar el desempeño de la propuesta principal del presente trabajo, las arcadas temporales superior e inferior de cada una de las imágenes fueron manualmente etiquetadas por médicos especialistas del Departamento de Oftalmología de la Unidad Médica de Alta Especialidad T1 del Instituto Mexicano del Seguro Social (IMSS), una vez que fue autorizado por el Comité Local de Investigación y Ética con número de registro R-2020-1001-128. Del total de imágenes capturadas, 119 imágenes fueron catalogadas como adecuadas y 17 como inadecuadas o limítrofes, de acuerdo con el criterio del especialista.
Segmentación Binaria de Estructura Vascular
La etapa de segmentación automática de venas de la retina se llevó a cabo mediante el método de Filtros Gaussianos de Correspondencia (Gaussian Matched Filters, GMF). En la Figura 1, se presenta el resultado de la segmentación binaria de venas de la retina a través del método GMF sobre un subconjunto de imágenes de fondo de ojo.
Nota: Primera fila: imágenes originales; Segunda fila: segmentación automática obtenida mediante el método GMF.
Para la evaluación de la segmentación, se utilizó la métrica Accuracy como medida de eficiencia, para la cual se obtuvo un valor de 0.9852.
Modelado numérico de la MTA
Para la evaluación de la segunda etapa, correspondiente al modelado numérico, se utilizó la medida de distancia MDCP. Los resultados fueron comparados numéricamente con el modelo parabólico propuesto por Oloumi y colaboradores (Oloumi, Rangayyan y Ells, 2012). El método utilizado en este trabajo tuvo un desempeño de 6.01 pixeles, con una varianza de 1.49 pixeles, mientras que el modelo parabólico reporta un resultado de 12.33 pixeles, como se muestra en la Tabla 1. Por otro lado, la Figura 2 muestra la comparación visual de los resultados del modelado numérico (línea azul) con las delineaciones manuales realizadas por expertos (línea verde).
Método | Base de Datos | Cantidad de Imágenes en la Base de Datos |
Cantidad de Imágenes en el Conjunto de Entrenamiento |
Cantidad de Imágenes en el Conjunto de Prueba |
MDCP promedio |
---|---|---|---|---|---|
Modelo parabólico (Oloumi, Rangayyan y Ells, 2012) |
DRIVE | 40 | 20 | 20 | 12.33 pixeles |
Método propuesto | IMSS | 136 | 100 | 36 | 6.01 pixeles |
Nota: El valor MDCP reportado corresponde al valor promedio obtenido en las imágenes en la Base de Datos.
Con respecto al tiempo computacional, se hizo una comparación de desempeño con el modelo implementado en el software MIPAV (McAuliffe et al., 2001) y la implementación del modelo parabólico con la Transformada General de Hough (Sánchez, 2007). Para este experimento se utilizó la base de datos DRIVE, pues es la utilizada en los métodos mencionados para reportar sus resultados. El método propuesto tiene un rendimiento de 10.65 segundos por imagen, frente a 6.3 y 42.15 segundos por imagen que reportan los modelos de MIPAV y la Transformada General de Hough, como se muestra en la Tabla 2.
Método | Tiempo (segundos por imagen) |
---|---|
Método propuesto | 10.65 |
Transformada General de Hough (Sánchez, 2007) | 6.3 (*) |
MIPAV software (McAuliffe et al., 2001) | 42.15 |
(*) El método de la Transformada General de Hough requiere que se tenga previamente identificado el vértice de la parábola, de lo contrario se debe realizar una búsqueda exhaustiva sobre todos los pixeles de la imagen, lo cual hace que el tiempo computacional incremente de manera proporcional al tamaño de la imagen.
Discusión
Se propuso un novedoso método para realizar el modelado numérico de las arcadas temporales superior e inferior en imágenes de fondo de ojo. En los últimos años, la medicina le ha estado apostando a este tipo de técnicas de procesamiento automático de imágenes, en especial a aquellas que son de escrutinio y prevención, debido a que ayudan a tener un diagnostico en etapas tempranas, así como un tratamiento oportuno. Con ello, se evita la progresión de las enfermedades, mejorando la calidad de vida de los pacientes y disminuyendo la carga laboral en consultas no necesarias para el especialista oftalmólogo, pudiendo otorgar mayor tiempo aquellas consultas que si lo requieren y de esta forma también mejorar la calidad de atención medica dirigida.
El análisis se realizó en personas con enfermedades crónicas no reportadas o consideradas sanas, cuya distribución de sexo, etnia y raza fue homogénea. La edad se mantuvo en un rango cerrado de una edad media de 29 años con una desviación estándar de 3 años. El estudio fue diseñado en una etapa inicial para la detección de cualquier anomalía retiniana sin integrar diagnóstico, con el fin de realizar el escrutinio de quien requiere una atención por parte del especialista oftalmólogo. No obstante, la metodología seguida fue planteada considerando que el objetivo siguiente es implementar el método desarrollado en la consulta diaria de atención primaria, es decir en la consulta de medicina familiar y medicina preventiva.
La evaluación se realizó para las dos etapas del método presentado. Para la etapa de segmentación automática de estructuras vasculares se obtuvo un rendimiento del 0.9852 en la métrica Accuracy, mientras que para la etapa de modelado numérico de la MTA se obtuvo un rendimiento de 6.01 pixeles en la métrica MDCP y 10.65 segundos en tiempo computacional por imagen. Los resultados obtenidos confirman la utilidad del método propuesto en la caracterización de las arcadas superiores e inferiores de la retina, lo cual puede asistir a los médicos de atención primaria en el diagnóstico de enfermedades de la retina.
En las siguientes etapas de este método, se pretende integrar algoritmos para identificar automáticamente las principales enfermedades de la retina. Además, para la implementación de este proyecto en las clínicas de atención primaria, es necesario considerar las siguientes adecuaciones para el procedimiento de recolección de imágenes de fondo de ojo, con el fin de tener una adecuada sensibilidad y especificidad:
1. El uso de fotografía de campo amplio, que cubre un área de la retina con más del doble del tamaño de la imagen para su análisis por el sistema de inteligencia artificial. La fotografía amplia permite ver adecuadamente las estructuras y proporciona una mejor calidad fotográfica, incluso en ausencia de otras lesiones retinianas, como exudados. En el caso de los otros estudios similares controlados en laboratorio (Abràmoff et al., 2013), el estándar de referencia se determinó a partir de las mismas imágenes que no eran amplias, disponibles para el sistema de inteligencia artificial, lo que no permite a los lectores expertos estimar el edema mácula diabético en ausencia de exudados.
2. El uso de fotógrafos oftálmicos experimentados para obtener fotografías de campo amplio estándar de referencia. Esto da como resultado una calidad de imagen, en general, más alta que la obtenida por el personal no profesional. Esta situación puede mejorar con una capacitación corta de 4 a 6 horas de entrenamiento, que se tendrá que realizar en las clínicas de atención primaria.
3. Los sistemas de inteligencia artificial son «fisiológicamente plausibles» hasta cierto punto, dados sus detectores múltiples, redundantes y específicos de lesiones para biomarcadores (Abràmoff et al., 2016), lo que conduce a una mayor robustez de pequeñas perturbaciones en las imágenes de entrada (Shah et al., 2018); los biomarcadores se basan en más de un siglo de experiencia clínica y muestran menor riesgo esperado de prejuicios étnicos o raciales.
4. En la cuestión de la edad es necesario ser muy juiciosos y ajustar los algoritmos matemáticos tomando en cuenta la membrana limitante interna, altamente reflectante en personas más jóvenes, que pueden confundirse con exudados y llevar a un falso diagnóstico o a un subdiagnóstico en cualquier retinopatía (Age-Related Eye Disease Study Research Group, 2001). Esta situación es un desafío para la técnica de inteligencia artificial que se plantea en este estudio, que se basa fuertemente en fotografías. La principal complicación sería, para casos con enfermedades crónicas, encontrar la presencia de opacidades en el cristalino debido a cataratas. Para lo cual sería necesario aumentar significativamente el número de intentos necesarios para obtener imágenes de calidad suficiente, así como el requisito de dilatación. Otros estudios ya se encontraron con esta complicación y al final se obtuvo una calidad de imagen suficiente en el 96.1 % de los casos (Abràmoff, Lavin, Birch, Shah y Folk, 2018).
Conclusiones
Se mostró que el método propuesto es una herramienta útil para el personal de salud que se encuentra en atención médica primaria y preventiva, donde se cuenta con un tiempo limitado para la evaluación integral del paciente. La herramienta propuesta también puede ser utilizada como apoyo para la confirmación del diagnóstico en caso de que el personal no esté capacitado para interpretar adecuadamente un fondo de ojo.
Los resultados obtenidos muestran que es factible llevar este tipo de métodos a la práctica clínica, a fin de elevar la calidad de las consultas y mitigar la saturación del servicio del especialista. Con ello sería posible lograr una disminución en el monto del costo anual del sistema de salud nacional, al tener diagnósticos oportunos y con menos complicaciones.