Inteligencia artificial en colonoscopia
La aplicación de la IA en colonoscopia abarca diferentes áreas a continuación, se presenta un trabajo de Low, et al.1, donde se creó un sistema de IA para la detección automática del ciego (se traduce en una colonoscopia completa), independientemente de la limpieza del colon, crearon una red neuronal convolucional (CNN) profunda que se entrenó con 13,513 imágenes (6,847 del ciego y 6,666 de imágenes no ciego), el ciego se definió por orificio apendicular y la confluencia de las tenias, no se discriminó en la limpieza, el resultado fue que este modelo tubo una precisión del 94%, una sensibilidad, especificidad, VPP y VPN de 0.96, 0.92, 0.92 y 0.96 respectivamente, la precisión con imágenes no ciego fue del 84%. Falta ver su impacto como marcador de una colonoscopia completa. En otro trabajo se analizó la utilidad de la IA como segundo espectador, Rodríguez-Díaz, et al.2 analizaron la utilidad del CADx como segundo lector o biopsia óptica (predecir la histología del pólipo), el modelo genera una superposición de color de visualización aumentada (CADx-AV) que tiene como objetivo aumentar la transparencia y la interpretación mediante la codificación de colores para la predicción histológica de la superficie de los pólipos, un panel de 7 endoscopistas evaluaron la librería de imágenes de magnificación más NBI de 175 pólipos < 5 mm (104 neoplásicos, incluyendo serrados, 71 no neoplásicos) de 96 pacientes. Por cada pólipo se dieron tres predicciones secuenciales del tipo de pólipo, neoplásico o no neoplásico, con su correspondiente nivel de confianza: una evaluación inicial por NBI, una posterior con la misma imagen NBI anotada con texto de la predicción CADx con nivel de confianza, y una tercera evaluación basada en una superposición CADx-AV de pseudocolor generada por el modelo, los resultados fueron que el modelo CADx tuvo una sensibilidad de 0.94, especificidad de 0.89, y una alta tasa de confianza (HCR), de 0.88; los 7 endoscopistas una sensibilidad de 0.97, especificidad de 0.76, y una HCR de 0.71, con la superposición del CADx-AV se obtuvo una sensibilidad de 0.97, especificidad de 0.84, y HCR de 0.84, este último tuvo una k = 0.60. Concluyendo que este modelo de CADx-AV como segundo lector mejora el desempeño del endoscopista. Los algoritmos CADe han demostrado su utilidad para corregir los «errores» humanos asistiéndolos durante los procedimientos, Bhakta et al.3, investigaron la precisión del sistema de CADe Discovery de Pentax (Discovery-AI) para pólipos de diferentes tamaños, este estudio fue realizado en dos hospitales. Mediante un estudio prospectivo se analizaron colonoscopias con pólipos, y normales, de junio a noviembre 2020, se revisaron tamaño del pólipo, localización y morfología (clasificación de París), los vídeos también fueron revisados por 3 gastroenterólogos especializados, se incluyeron 435 vídeos: 230 de pólipos y 205 normales (controles). Lo resultados fueron: la precisión general del sistema Discovery-AI fue del 99.1% (228/230), la tasa de detección para pólipos < 5 mm fue del 97.8% (90/92) y del 100% para > 5 mm, el sistema perdió 2 pólipos de 3 mm (hiperplásico y adenoma), el conjunto con la asistencia los gastroenterólogos encontraron 14 (6.8%) pólipos que no habían sido vistos en la revisión sin el algoritmo, concluyendo que el binomio humano-Discovery-AI es útil para mejorar la tasa de detección de pólipos. En esta misma línea, Ishiyama, et al.4 llevaron a cabo un estudio piloto, prospectivo, no aleatorizado, de un solo centro para demostrar si en verdad el sistema CADe mejora la detección de neoplasia. El estudio se realizó de julio a agosto del 2020, se utilizó el sistema EndoBRAIN-EYE, se hicieron dos grupos: grupo CAD con 337 pacientes y grupo control con 431 pacientes. La tasa de detección de adenomas (ADR) del grupo CAD fue del 21.1% vs. grupo control del 10.7% (p = 0.0001), de igual forma tanto para tasa de detección de pólipos como para número de adenomas por colonoscopia el CAD fue superior, pero con respecto a tasa de detección de neoplasias avanzadas no hubo diferencia significativa (CAD 3.3% vs. 1.4% control; p = 0.09), concluyendo que el sistema CADe provee mejor tasa de detección de pólipos y adenomas, pero no hay un incremento significativo en la detección de neoplasias avanzadas. Otro trabajo, pero ahora de Misawa, et al.5 demostró que el sistema AI-CADx + NBI tiene la sensibilidad, especificidad, VPN y precisión para el diagnóstico de adenomas < 10 mm del 98.4, 58.3, 95.5 y 85% respectivamente, por lo que podría evitar polipectomías innecesarias y disminuir las complicaciones pospolipectomía; se requieren más estudios para esto. Siguiendo en esta línea de precisión diagnóstica, Okamoto, et al.6 desarrollaron un sistema CADx para el diagnóstico de lesiones colorrectales utilizando imágenes con y sin magnificación más NBI (utilizando las clasificaciones de JNET y NICE), evaluaron su utilidad diagnóstica. El resultado fue: la precisión diagnóstica del CADx + JNET para los T1: 95%, T2A: 95%, T2B: 85% y T3: 100%, con sensibilidad/especificidad de T1:95/94%, T2A: 89/96%, T2B: 88/96% y T3: 100/92%, ahora CADx + NICE (no magnificación vs. magnificación) la precisión diagnóstica fue de T1 100% vs. 95% (NS), T2 80% vs. 90% (NS), y T3 90% vs. 100% (NS), concluyendo que el sistema CADx tiene precisión diagnóstica utilizando las clasificaciones JNET y NICE, más NBI para el diagnóstico de lesiones colorrectales cuando no se dispone de magnificación.
Inteligencia artificial en esófago de Barrett
En un trabajo prospectivo de van der Laan et al.7, utilizando endocitoscopio (EC) para diferenciar entre tejido con displasia y sin displasia compararon el rendimiento entre médicos y sistema CADx, se entrenó al sistema con vídeos de EC, se utilizaron dos grupos, el primero (humano: 5 expertos en EB, 5 gastroenterólogos y 5 residentes) fue entrenado en línea y calificado, el segundo grupo fue el CADx, el cual fue entrenado con imágenes y puesto a prueba con otro grupo diferente de imágenes, los resultados fueron que la precisión, sensibilidad y especificidad de los clínicos antes del entrenamiento (n = 14) fue del 62.6, 56.2 y 70.6%, posterior al entrenamiento (n = 14) fue del 78.6% (p < 0.05), 86.2% (p < 0.05) y 69.5% (p > 0.05) respectivamente, después de un intervalo de 2 semanas, en 9 la precisión y la sensibilidad bajaron significativamente a 73.0 y 75.6% respectivamente, mientras que el algoritmo tuvo una precisión, especificidad y sensibilidad en más de 5 pruebas del 79.6, 74.0 y 85.3% respectivamente, concluyendo que el algoritmo tiene una adecuada precisión y utilidad en la práctica clínica, mientras que los clínicos requieren entrenamiento y constancia para mantener su precisión.
Inteligencia artificial en ultrasonido endoscópico
Con respecto a la IA+USE, Kyo Oh, et al.8 presentaron un trabajo el cual desarrollaron una CNN de detección para tumores gástricos subepiteliales (TGS) que discriminara entre tumores de estroma gastrointestinal (GIST) y leiomiomas mediante USE, entrenaron el sistema con 3,008 imágenes de 114 pacientes con GIST o leiomiomas, posteriormente se validó con 170 imágenes de 54 pacientes, los resultados fueron: en un análisis por imagen la sensibilidad, especificidad y precisión fueron del 95.6, 83.9 y 91.8% respectivamente, el AUC para discriminar las imágenes de USE fue de 0.9616. En un análisis por paciente la sensibilidad, especificidad y precisión fueron del 97.5, 92.9, y 96.3% respectivamente con un AUC para predecir el diagnóstico de 0.9857. Concluyendo que el sistema USE-CNN tiene capacidad para predicción de GIST, siendo este de utilidad para endoscopistas menos experimentados y disminuir costos.
Conclusiones
Sin lugar a dudas la IA ya forma parte de varios centros de endoscopia alrededor del mundo, siguiendo el camino desde su origen hasta ahora podemos ver que su mayor utilidad está en centros de detección, centros de educación y en el apoyo tanto de endoscopistas en formación, como en aquellos con poca experiencia, ya que los mejores resultados se obtienen cuando se suma la máquina con el humano.