Introducción
Los medicamentos representan un riesgo para la salud de la población, por tal motivo, es imprescindible evaluar el riesgo/beneficio para cada uno de ellos. El Centro Nacional de Farmacovigilancia (CNFV) de México demuestra que desde 1995 al 2014, se incrementó el número de notificaciones de reacciones no deseadas de medicamentos provocadas por interacciones farmacológicas y que la industria farmacéutica presentó el mayor número de esas notificaciones (COFEPRIS, 2014). La industria farmacéutica en México ha participado con 1.30% en el PIB, esta industria se encuentra dentro de los 15 principales mercados a nivel mundial y esto, significó ser el segundo mercado más importante para América latina (Caso, 2011). Por estas razones, el sector farmacéutico, en conjunto con el sector salud, son fundamentales para México (Cómite de Competitividad Centro de Estudios Sociales y de Opinión Pública, 2010).
La Interacción Farmacológica (IF) es la modificación del efecto de un fármaco por la acción de otro fármaco, además, puede causar efectos leves, moderados o graves; o hasta provocar la muerte de un ser humano. Por tal motivo, existe una ciencia que se llama farmacovigilancia que investiga, vigila y evalúa la información sobre los efectos de los medicamentos para identificar información de las reacciones no deseadas de medicamentos y prevenir los daños en los pacientes (Secretaría de Salud, 2014).
Este trabajo tiene como objetivo establecer un proceso tecnológico de soporte, a la farmacovigilancia con base en los Sistemas de Reconocimiento de Patrones (SRP) para identificar la gravedad de la IF, antes y después de la comercialización de un medicamento y así, aproximarse a predecir nuevas interacciones farmacológicas.
Los SRP son procesos complejos que se han implementado en aplicaciones de reconocimiento de voz, identificación de huellas dactilares, reconocimiento óptico de caracteres, la identificación de secuencias de ADN, reconocimiento de rostros, clasificación de correos spam, entre otras (Duda et al., 2001; Hernández et al., 2004). Entonces, es muy importante construir SRP para problemas específicos que requieran el uso de estas técnicas. El problema que se plantea en este trabajo es la clasificación de la gravedad de una IF que presenta tres clases: leve, moderada o grave (Idoctus México, 2016).
Se propone generar un Modelo de Clasificación (MC) que utilice un algoritmo Naïve Bayes (NB) que se fundamenta en características o atributos condicionalmente independientes, porque la IF presenta ese tipo de características. Es decir, en un paciente la gravedad de una IF se manifiesta por el consumo de dos o más fármacos; la dosis de cada fármaco; el consumo de alimentos; y aspectos físicos del paciente como su altura, peso, edad, metabolismo e historial clínico (Secretaría de Salud, 2014). Este trabajo de investigación se enfoca en la IF del tipo fármaco-fármaco.
El MC se generó en Weka (Waikato Environment for Knowledge Analysis) porque es una plataforma de software para el aprendizaje automático y la minería de datos que permite utilizar diferentes técnicas de clasificación para poder evaluar el rendimiento de diferentes algoritmos (Han et al., 2005).
El MC se realizó empleando validación cruzada a 10 pliegues, comúnmente utilizada en procesos de clasificación (Han et al., 2012). Este método de validación cruzada divide el corpus en 10 grupos en donde se usa un grupo para el entrenamiento y 9 para pruebas, se calcula el error y se repite el proceso 10 veces cambiando el conjunto de entrenamiento (Han et al., 2012).
En la propuesta del modelo de clasificación del algoritmo Naïve Bayes se comparó este con el algoritmo Random Forest con la finalidad de discutir los resultados de cada uno de ellos.
Materiales y métodos
En este trabajo se desarrolló un modelo de clasificación. Para ello se construyó un corpus utilizando diccionarios médicos como iDoctus México (Idoctus México, 2016), PLM México (PLM México, 2017) y Vademécum (VADEMECUM, 2011) en formato electrónico, que contienen información de las interacciones farmacológicas de México. Estos recursos digitales facilitan la creación de corpus de interacciones farmacológicas. El modelo que se construyó utiliza el aprendizaje supervisado (Manning y Schütze, 1999).
Siguiendo las etapas: colección de datos, selección de características, selección del modelo matemático, entrenamiento, pruebas y complejidad computacional (Duda et al., 2001).
El esquema general del modelo de clasificación se muestra en la Figura 1, en el que se describen las 5 etapas del ciclo de diseño que se utilizaron para construir el MC. En la primera etapa de colección de datos se recolecta información de muestras de interacciones farmacológicas leves, moderadas o graves para desarrollar un corpus. En la segunda etapa de selección de características se seleccionan los nombres de dos fármacos que forman una IF, en la tercera etapa de selección del modelo matemático se analiza precisamente el modelo matemático Naïve Bayes, en la cuarta etapa de entrenamiento se genera el Modelo de Entrenamiento (ME) con base en el modelo matemático NB y el corpus y en la quinta etapa de evaluación se realizan las pruebas del clasificador.
Colección de datos
Se analizaron diferentes diccionarios médicos como PLM, VADEMECUM, MICROMEDEX e IDOCTUS México, que fueron recomendados por un especialista farmacéutico, el Dr. José Gustavo López de la Facultad de Ciencias Químicas. Se seleccionó IDOCTUS México por su usabilidad; su organización de la información y porque está basado en la base de datos farmacológica del Consejo General de Colegios Oficiales Farmacéuticos (Idoctus Mexico, 2016). Posteriormente, se recolectaron del IDOCTUS, las interacciones farmacológicas presentadas en los medicamentos más frecuentes del Hospital Universitario de Puebla. De los 360 fármacos se obtuvo un corpus con 540 IFs, donde 180 IFs pertenecen a cada clase: leve, moderada o grave.
Es importante el procesamiento del lenguaje natural porque influye en los resultados del MC. Por este motivo, se realizó un pre-procesamiento al corpus de IFs porque su datos pueden ser incompletos o inconsistentes, lo que ocasiona la extracción de patrones poco útiles (Zhang et al., 2003). Se aplicó un pre-procesamiento al corpus a través de un algoritmo desarrollado con AWK (Aho et al., 1979), que realiza la tarea de corrección y eliminación de los datos incompletos e inconsistentes del corpus, convirtiendo letras mayúsculas en minúsculas, borrando los signos de puntuación y acentos (Aguirre y Edmonds, 2007). En la Tabla 1 se observa el diseño del corpus de IFs que presenta cinco columnas. En la primera columna se indica el número de IF que es una asignación de un identificador a la interacción farmacológica; en la segunda columna se indica la etiqueta que es la clase a la que pertenece la IF (leve, moderada o grave); en la columna tres y cuatro se encuentran los fármacos que forman a la IF; y en la última columna se ubica el efecto de la IF en el humano. Se diseñó de esta forma el corpus de IFs para facilitar el reconocimiento de patrones, evitar información irrelevante y realizar la extracción de características en el MC. En la Figura 2 se observa un resultado pre-procesado del corpus.
If # | Etiqueta | Fármaco 1 | Fármaco 2 | Efecto |
---|---|---|---|---|
IF 1# | Grave | amiodarona | acenocumarol | posible potenciación del efecto anticoagulante peligro de hemorragias |
IF …# | …. | … | ... | … |
IF 180# | Grave | levomepromazina | fosfenitoina | …. |
IF …# | …. | … | ... | … |
IF 360# | Moderada | levomepromazina | asenapina | … |
IF …# | …. | … | ... | … |
IF 540# | Leve | ketorolaco | Valsartan | … |
Selección de características
La selección de características es un campo de investigación importante en los SRP, en el aprendizaje automático y en la minería de datos. La selección de características ha demostrado tanto en la teoría como en la práctica que es eficaz para mejorar la eficiencia del aprendizaje y aumentar la precisión predictiva del MC, su objetivo es elegir un subconjunto de datos de entrada eliminando características que son irrelevantes o que no tienen información predictiva del corpus de IFs (Ramaswami y Bhaskaran, 2009).
En este trabajo se seleccionaron tres características o atributos del corpus de IFs: el fármaco 1, el fármaco 2 y la gravedad (leve, moderada o grave). La razón de su selección fue que estas características constituyen a una IF del tipo fármaco-fármaco (Secretaría de Salud, 2014) y cumplen con los requerimientos de la selección de características, en donde los datos deben ser invariantes y únicos (Duda et al., 2001).
Selección del modelo matemático
La selección del modelo matemático es Naïve Bayes porque una IF presenta características independientes, es decir, la IF no se presenta únicamente por la combinación de dos o más fármacos, sino también por la dosis de cada fármaco, por el consumo de alimentos, el historial clínico del paciente, por los aspectos físicos del paciente como su edad, altura, peso, metabolismo y otros factores (COFEPRIS, 2014). Este trabajo se enfoca en la IF del tipo fármaco-fármaco (Secretaría de Salud, 2014). Además, Zhang menciona que, NB es uno de los más eficientes y efectivos algoritmos de aprendizaje inductivo para el desarrollo de aprendizaje automático y de minería de datos (Zhang, 2005). Adicionalmente, es uno de los clasificadores más utilizados por su simplicidad y rapidez (Witten y Frank, 2005).
NB se fundamenta en el Teorema de Bayes que consiste en la probabilidad condicional. Sin embargo, NB asume ingenuamente que las características no son condicionales y son independientes, esto se demostró en el trabajo de Domingos y Pazzani (1997), obteniendo como resultado la fórmula de NB. A diferencia de otros modelos matemáticos, en este modelo se contabilizan las frecuencias de ocurrencias de las características seleccionadas y no se realizan búsquedas de hipótesis (Morales, 2012).
donde
P(V j ) |
= Frecuencia de las clases leve, moderada y grave |
|
= Frecuencia de los datos observados, que son los fármacos |
|
= Argumento Máximo de las probabilidades leve, moderada o grave |
En el trabajo de Ruiz, se menciona que para mejorar la precisión numérica de NB, generalmente se implementa la propiedad de logaritmo, esto permite obtener mejores resultados en la fórmula de NB, porque evita que las estimaciones de probabilidades se aproximen a cero. La fórmula de NB con la implementación de la propiedad de logaritmo es
Entrenamiento
En la fase de entrenamiento se estima
donde
F k |
= Frecuencia de un fármaco que pertenece a la misma clase |
F |
= Frecuencia del total de fármacos que pertenecen a la misma clase |
Vocabulario |
= Número de fármacos de todas las clases del CE |
Los resultados de las estimaciones de las probabilidades de los fármacos por cada una de sus clases son almacenados en una estructura de datos llamada tabla hash o Diccionario de Palabras (DP). Este DP es el modelo de entrenamiento que se genera con base en el CE previamente pre-procesado, su diseño se presenta en la Tabla 2.
Pruebas
En esta fase se utilizó la plataforma Weka que consta de 3 partes. En la primera parte se generó un archivo arff que contiene tres atributos: fármaco 1, fármaco 2 y gravedad. En el mismo archivo, se agregaron las 540 instancias de interacciones farmacológicas. En la Tabla 3 se muestran los datos de interacciones farmacológicas en un archivo arff que se utilizó en la plataforma Weka.
En la segunda parte, se introduce el archivo de datos en la plataforma Weka y se selecciona el algoritmo de clasificación NB. Se ejecuta el mismo utilizando validación cruzada a 10 pliegues.
El método de validación cruzada es una técnica utilizada para modelos de clasificación. La validación cruzada se implementó con un valor de K igual a 10 (Hernández et al., 2004). En la Figura 3, se muestra el proceso de validación cruzada, en donde el corpus de IFs se divide en 10 grupos, en el primer pliegue K=1 se selecciona el grupo 1 para pruebas y se seleccionan del grupo 2 al 10 para entrenamiento, posteriormente en el segundo pliegue K=2 se selecciona el grupo 2 para pruebas y se seleccionan del grupo 3 al 10 y el grupo 1 para entrenamiento. En cada pliegue, se dividió el corpus en 90% para entrenamiento y 10% para pruebas. Este proceso se repite hasta la pliegue K = 10.
Finalmente, en cada pliegue se evalúan los resultados y se promedian de los 10 pliegues para obtener el resultado de las métricas de precisión, recuerdo y F-measure (Hernández et al., 2004).
Evaluación
Es importante analizar las métricas de clasificación que existen en los sistemas de aprendizaje automático para evaluar y comprender el rendimiento de un modelo de clasificación (Lever et al., 2016). En este trabajo se evalúa el MC por las siguientes métricas: precisión, recuerdo y F-measure (Computer Science Department Cornell University, 2003). En la Figura 4, se muestra una matriz de confusión para n clases (Manligues, 2017), con esta matriz se calcularon las métricas de evaluación.
El número Total de Falsos Negativos (TFN), Total de Falsos Positivos (TFP), Total de Verdaderos Negativos (TVN) y Total de Verdaderos Positivos (TVP) para cada clase i se calculan con las siguientes fórmulas (Manligues, 2017).
donde
(TVP) |
Total de Verdaderos Positivos = número total de interacciones farmacológicas asignadas correctamente a su clase (leve, moderada o grave). |
(TFP) |
Total de Falsos Positivos = número total de interacciones farmacológicas asignadas incorrectamente a su clase. |
(TFN) |
Total de Falsos Negativos = número total de interacciones farmacológicas incorrectamente rechazadas a su clase. |
(TVN) |
Total de Verdaderos Negativos = número total de interacciones farmacológicas correctamente rechazadas a su clase. |
Finalmente, se calcula la precisión, el recuerdo y el F-measure para cada clase con las siguientes fórmulas (Manligues, 2017).
Análisis de resultados
El primer resultado es un corpus con 540 instancias de interacciones farmacológicas etiquetadas por su tipo de gravedad como leve, moderada o grave.
Los resultados que se presentaron en la evaluación y los experimentos del modelo de clasificación con el algoritmo Naïve Bayes son los siguientes. En el experimento con el método de validación cruzada con 10 iteraciones se obtuvo una precisión de 79.1%, un recuerdo de 75.7% y un F-measure de 74.8%. Los resultados por cada clase leve, moderada o grave se presentan en la Tabla 4.
Clase | Precisión | Recuerdo | F-measure |
---|---|---|---|
Grave | 92.9% | 51.1% | 65.9% |
Moderada | 68.4% | 90% | 77.7% |
Leve | 76% | 86.1% | 80.7% |
Total | 79.1% | 75.7% | 74.8% |
El algoritmo NB se comparó con el algoritmo Random Forest. Los resultados del MC con el algoritmo Random Forest son en precisión 51.7%, en recuerdo un 51.7% y en F-measure 50.7%. Los resultados por cada clase se presentan en la Tabla 5.
Clase | Precisión | Recuerdo | F-measure |
---|---|---|---|
Grave | 45.5% | 28.3% | 34.9% |
Moderada | 42.7% | 57.2% | 48.9% |
Leve | 66.8% | 69.4% | 68.1% |
Total | 51.7% | 51.7% | 50.7% |
Se observa que al utilizar el método de validación cruzada con 10 pliegues, el algoritmo NB presentó mejores resultados que el algoritmo de Random Forest.
Conclusiones y trabajo futuro
En este artículo se desarrolló un corpus de interacciones farmacológicas clasificadas por su tipo de gravedad (leve, moderada o grave) usando el diccionario médico de IDOCTUS, en donde se obtuvieron las 540 interacciones fármacologicas de los fármacos más utilizados en el Hospital Universitario de Puebla. Se generó un modelo de clasificación utilizando el algoritmo Naïve Bayes porque la IF presenta atributos o características independientes. Además, se realizaron las pruebas para evaluar el MC utilizando un método de experimentos llamado validación cruzada con un K igual a 10 pliegues. Se analizaron los resultados y se comparó con el mismo método de validación cruzada el algoritmo Naïve Bayes con el algoritmo Random Forest. En la comparación, el algoritmo NB presentó mejores resultados.
En el trabajo de Kukreja, se presenta una comparación de un algoritmo NB con el algoritmo Random Forest utilizando el método de validación cruzada, en donde, Random Forest presentó un mejor rendimiento en conjuntos de datos con múltiples clases y el algoritmo NB presentó mejores resultados en un conjunto de datos con 4 clases (Kukreja et al., 2012).
En este trabajo, el algoritmo NB presentó mejores resultados que Random Forest porque se identificaron solo tres clases en la IF: leve, moderada o grave. Además, la IF presentó características independientes por lo cual esta investigación se enfocó en el modelo matemático Naïve Bayes.
El trabajo futuro es incluir nuevos atributos al corpus de IF para actualizar el MC, los atributos que se pueden agregar son: la dosis de los fármacos, los aspectos físicos de un paciente: altura, peso, edad y metabolismo y el historial clínico de un paciente.
Finalmente, este MC brinda una herramienta para automatizar la identificación de la gravedad de las interacciones farmacológicas en las áreas de ciencias químicas, farmacología y farmacovigilancia. Adicionalmente, permite aproximarse a descubrir nuevas interacciones fármacologicas para evitar dañar la salud de los pacientes con tratamientos farmacológicos.