Introducción
La Diabetes Mellitus (DM) es una enfermedad crónica que puede afectar diversos sistemas de órganos humanos (Perkisas & Vandewoude, 2016) representando un peso económico, para las economías familiares y nacionales, cuadruplicándose la cantidad de adultos mayores que la padecen, a través de la etapa 1980-2014, donde alcanzan los 422 millones de pacientes (Fagherazz & Ravaud, 2019).
En particular, los pacientes que sufren de la Diabetes Mellitus tipo 2 (DM2) pueden desarrollar graves complicaciones que atentan contra su calidad de vida, según la International Diabetes Federation (2019).
En concordancia con la Asociación Americana de Diabetes (citado en Sánchez, Vega, Gómez, &Vilema, 2020), la DM2 es causada por una pérdida sistemática de la secreción de insulina de células β, con frecuencia en lo relativo a la resistencia a la insulina, de acuerdo con Sánchez, Vega, Gómez, &Vilema (2020).
Ante esta enfermedad, se requieren estudios soportados en herramientas estadísticas que ayuden a predecir la misma, entre las que se encuentra la regresión logística, que surge en la década de los años 60 del siglo XX, a partir de los estudios de Cornfield, Gordon & Smith (1961), y posteriormente Walter y Duncan la utilizan tal como se le conoce hoy. Representa un método estadístico que posibilita crear modelos cuya variable respuesta sea cualitativa, definiendo la probabilidad de corresponder a una clase como una función de distribución logística (Robles-Velasco, Cortés, Muñuzuri, y Barbadilla-Martín, 2020).
Concordando con Berlanga-Silvente, y Vilà-Baños (2014), los modelos de regresión logística posibilitan conocer la relación existente entre una variable dependiente, específicamente cualitativa dicotómica (regresión logística binomial o binaria) y diversas variables explicativas independientes, conocidas como covariables, pudiendo ser éstas cuantitativas o cualitativas, aunque igualmente se puede analizar a una variable dependiente de tipo cualitativa con más de dos valores, conociéndose entonces como regresión logística multinomial.
Como antecedentes del presente estudio, en el cual se encuentra un nexo significativo entre la práctica médica y la estadística (Berea, Rivas, Pérez, Palacios, Moreno, y Talavera, 2014), se encuentran varias investigaciones, entre las que se pueden mencionar a la propuesta de un modelo predictivo del posible desarrollo de la DM postrasplante renal (Borroto y Rodríguez, 2009); el estudio predictivo para el padecimiento de pie diabético en pacientes con DM2 (López, Yanes, Suárez, Avello, Gutiérrez, y Alvarado, 2016); así como otro estudio que detalla los posibles escenarios sobre la evolución futura de la prevalencia de la DM (Docampo & López, 2018).
El problema de investigación afrontado en el presente estudio es: ¿Cómo predecir la DM2 en pacientes adultos? Para solucionar el problema, se utiliza la regresión logística binaria como herramienta estadística que permite predecir la DM2, en este caso en una población de estudio conformada por 628 pacientes de un Consultorio Médico en Matanzas, Cuba.
Las hipótesis de trabajo fueron: (1) La variable Hipertensión Arterial (HTA) si está asociada a la DM2, y (2) La variable predisposición genética si está asociadas a la DM2.
Los métodos y procedimientos que se utilizan se alinean con los estándares éticos de la Declaración de Helsinki de 1975, revisada en 1983 (Di & Ángeles, 2011). Además, el estudio se soporta con el acuerdo de confidencialidad con cada paciente estudiado, donde se considera, además, su consentimiento informado.
Desarrollo
Taxonomía de la investigación
Fue un estudio desarrollado en diciembre de 2015, de tipo observacional (no se realizó ninguna intervención en la población de estudio), transversal (todas las variables fueron medidas en una sola ocasión); retrospectivo (los datos se tomaron de las historias clínicas de los pacientes), y analítico (el análisis estadístico fue multivariado) correspondiente al nivel predictivo (Supo, 2014).
Variables de estudio
La variable dependiente (endógena) fue la DM2 y las variables independientes (exógenas) fueron, la edad, el sexo, la HTA, y la predisposición genética.
En el Cuadro 1 se muestra la operacionalización de estas variables de estudio.
Variables independientes | Indicadores | Valor Final | Tipo de variable |
---|---|---|---|
Edad | Fecha de nacimiento | Años | Numérica de Razón |
Sexo | Caracteres sexuales secundarios | Masculino Femenino | Nominal Dicotómica |
HTA | Diagnóstico de hipertenso | Si No |
Nominal Dicotómica |
Predisposición genética | Antecedente familiar de diabetes | Si No |
Nominal Dicotómica |
Variable dependiente | Indicador | Valor Final | Escala |
DM2 | Diagnóstico de DM2 | Si No |
Nominal Dicotómica |
Fuente: elaboración propia.
Se intentó confirmar que las variables edad y sexo no están asociadas de forma estadísticamente significativa, a la DM2, por lo que no fue necesario partir de una hipótesis del investigador (H1), al coincidirse en este caso con el criterio H0 que apoyaría la independencia entre las variables. Paralelamente se pretendió demostrar que las variables HTA y predisposición genética si están asociadas a la DM2.
Se partió del planteamiento de las hipótesis siguientes:
H1: La variable HTA si está asociadas a la DM2.
H2: La variable predisposición genética si está asociadas a la DM2.
Se consultaron las historias clínicas de todos los pacientes estudiados (confeccionadas por la autora principal de este estudio, lo cual disminuyó el sesgo) y se elaboró un protocolo consensuado que contuvo las variables mostradas en el Cuadro 1. Las mismas se conceptualizaron de la forma siguiente:
Edad: se contabilizó la edad cronológica (cifra de años vividos) en números exactos, o sea, sin redondearlos.
Sexo: se catalogaron a los pacientes según sus características fisiológicas y biológicas en Masculino y Femenino.
HTA: en concordancia a lo registrado en las historias clínicas, se tomaron mediciones dos días diferentes y en ambas lecturas la tensión sistólica fue superior o igual a 140 mmHg y la diastólica superior o igual a 90 mmHg, de acuerdo con la Organización Mundial de la Salud, (2019).
Predisposición genética: se conceptualizó como pacientes con herencia de DM2 a los que tuvieron antecedentes de esta enfermedad en su familia de primer grado (padre y madre) y familia de segundo grado (abuelos paternos y maternos), según los registros de las historias clínicas.
DM2: síndrome heterogéneo producido por la interacción genético-ambiental y caracterizado por una hiperglucemia crónica, como consecuencia de deficiencias en la secreción o acción de la insulina, que crea complicaciones agudas.
Población de estudio
La población de estudio estuvo conformada por 628 pacientes adultos de un Consultorio Médico del Policlínico “Carlos Verdugo”, en el Reparto “Camilo Cienfuegos”, ciudad de Matanzas, Cuba.
Criterios de inclusión
Se incluyeron a los adultos mayores (65 años o más) que padecían de DM2 en el instante en que se efectuó el estudio y que dieran su consentimiento informado para participar en el mismo.
El 100% de ellos estuvo de acuerdo con participar en el estudio, por lo que no fue necesario calcular una muestra.
Análisis estadístico
Los datos fueron examinados con el uso del paquete de software IBM SPSS Statistics (v. 25.0, Edición de 64 bits), utilizándose previamente Microsoft Excel 2019, para la creación de una base de datos que incluyera toda la información estadística del estudio.
Para el tratamiento estadístico, en el caso de la variable edad, de tipo numérica, se dicotomizó a partir del punto de corte de 65 años, convirtiéndose así en variable nominal dicotómica, teniendo en cuenta el criterio de que con 65 años se entra en la categoría de adulto mayor, por lo cual la clasificación de la edad quedó como adulto mayor o no adulto mayor.
Existen diversos modelos que son predictivos que lo que analizan son predictores de la enfermedad, que presentan otros estadísticos, pero en este estudio, se utilizó un modelo explicativo, es decir, se trabajó con una variable dependiente (endógena), en este caso tener una enfermedad (DM2) a la que se les estudiaron los factores (variable exógena) que afectan a tener la misma (edad, sexo, HTA y predisposición genética).
Ética y consentimiento informado
El estudio no implicó daños a los pacientes, cuyos identificadores individuales fueron omitidos de los archivos, para proteger la confidencialidad.
Resultados
La edad promedio del total de pacientes estudiados fue de 69,70 años, oscilando la misma entre 61 y 93 años (DE 5,764). Del total de 628 pacientes (430 mujeres y 198 hombres), solo 128 (20.4%) no eran adultos mayores y los otros 500 (79.6%) si lo eran, al poseer 65 o más años.
En la Tabla 1 se expone el análisis estadístico bivariado para las variables que no están en la ecuación.
Variables | Puntuación | gl | Sig. |
---|---|---|---|
Sexo | 2,145 | 1 | 0,143 |
Predisposición genética | 228,906 | 1 | 0,000 |
HTA | 393,212 | 1 | 0,000 |
Edad | 0,116 | 1 | 0,733 |
Estadísticos globales | 424,988 | 4 | 0,000 |
Fuente: elaboración propia.
En la Tabla 2 se aprecia el análisis multivariado para las variables en la ecuación.
Variables | Coeficiente del modelo de regresión logística binaria (B) | Error estándar o típico del coeficiente B | Chi Cuadrado de Wald | gl | Sig. | Exponente B |
---|---|---|---|---|---|---|
Sexo | -0,286 | 0,305 | 0,880 | 1 | 0,348 | 0,751 |
Predisposición genética | 2,481 | 0,325 | 58,142 | 1 | 0,000 | 11,951 |
HTA | 4,103 | 0,308 | 177,385 | 1 | 0,000 | 60,498 |
Edad | 0,477 | 0,356 | 1,788 | 1 | 0,181 | 1,611 |
Constante | -3,351 | 0,396 | 71,415 | 1 | 0,000 | 0,035 |
Fuente: elaboración propia.
La Tabla 3 hace un resumen del modelo planteado. La R cuadrado de Cox y Snell representa un coeficiente de determinación generalizado válido para estimar la proporción de varianza de la variable dependiente, explicada por las variables predictoras (independientes). Tiene un valor máximo inferior a 1, inclusive para un modelo “perfecto”. Se fundamenta en la comparación del log de la verosimilitud (LL) para el modelo en relación al LL para un modelo de línea base. Sus valores fluctúan entre 0 y 1.
Logaritmo de la verosimilitud -2 | R cuadrado de Cox y Snell | R cuadrado de Nagelkerke |
332, 358a | 0,552 | 0,750 |
a. La estimación ha terminado en el número de iteración 6 porque las estimaciones de parámetro han cambiado en menos de 0,001.
Fuente: elaboración propia.
Por su parte, la R cuadrado de Nagelkerke representa una versión corregida de la R cuadrado de Cox y Snell, pues corrige la escala del estadístico para cubrir el rango completo de 0 a 1.
Finalmente, la Tabla 4 expone las pruebas ómnibus de coeficientes del modelo.
Discusión
Tanto la hipótesis H1: La variable HTA si está asociadas a la DM2; como la hipótesis H2: La variable predisposición genética si está asociadas a la DM2 se cumplieron.
De acuerdo con la Tabla 1, algunas de las variables seleccionadas si pueden predecir la enfermedad de la DM2 mediante el modelo de la regresión logística binaria, dado que el p-valor fue menor que 0,05. En este caso se encuentran HTA y predisposición genética.
No obstante, no ocurre lo mismo con las variables edad y sexo, pues su p-valor es mayor que 0,05.
La variable edad, al dicotomizarla, pudo ser utilizada para realizar la prueba de Chi-cuadrado, pero su p-valor no fue significativo a nivel bivariado, al corresponderle un valor de 0,733.
En el caso de la variable sexo, tampoco fue significativa, a nivel bivariado, su relación con la DM2, pues el p-valor fue de 0,143.
La variable HTA si está asociada a la ocurrencia de la enfermedad (p-valor = 0,000), al igual que la variable predisposición genética (p-valor = 0,000).
El coeficiente del modelo de regresión logística binaria (B) pertenece a la estadística predictiva y permitió construir el modelo, que no es más que un algoritmo que ayudó a predecir un resultado en función a las otras variables (Tabla 2). El error típico o estándar permitió calcular el intervalo de confianza.
El Chi-cuadrado de Wald es un Chi Cuadrado muy similar al test de independencia, pero multivariado, es decir, relacionada cada variable independiente con la variable dependiente, considerando las comparaciones, pero teniendo en consideración el resto de las variables, es decir, no exclusivamente comparando de dos en dos, sino de forma multivariada.
El exponente B es similar al Riesgo Relativo (OR), pero en este caso viene siendo un OR multivariado, por lo cual hay similitud con su lectura final.
Los resultados mostrados en la Tabla 2 evidencian que quienes tuvieron la predisposición genética tienen 11,951 veces más riesgo de enfermar de DM2, respecto a los que no tuvieron ese antecedente. Igualmente, se evidenció que quienes tuvieron HTA tienen 60,498 veces más riesgo de enfermar de DM2, respecto a los que no la tuvieron.
De acuerdo con la Tabla 3, el valor de R cuadrado de Cox y Snell (0,552), la DM2 de la población correspondiente al presente estudio, se puede predecir, considerando las variables analizadas, en un 55.2%. Por su parte, en concordancia con el resultado de R cuadrado de Nagelkerke (0,750), la DM2 de la población estudiada, se puede predecir, considerando las variables analizadas, en un 75.0%.
En resumen, puede afirmarse que para saber si las variables incluidas en el análisis predicen o no predicen la DM2, se analizó la prueba del ómnibus (Tabla 4) y su p-valor, que en el presente estudio si fue significativo (p-valor = 0,000) en un 55.2%, según el modelo matemático de R cuadrado de Cox y Snell, y en un 75% de acuerdo con el modelo matemático de R cuadrado de Nagelkerke.
La prueba ómnibus debe ser significativa para poder interpretar el modelo logístico, lo cual ocurre en el presente estudio. El contraste que se hizo con esta prueba fue comprobar que dentro de los coeficientes del modelo al menos hubo uno que no tuvo valor cero, de modo que la variable dependiente está explicada al menos por una variable, pues es evidente que si no hay ninguna variable que explique el modelo, al final solo se explica por una constante y no tendría sentido epidemiológico, en este caso.
La Chi-cuadrado arrojó un valor de 504,920, con 4 grados de libertad y un contraste significativo (p-valor = 0,000).
La comunidad científica internacional se esfuerza por estudiar la DM2 y su predicción, con valiosos aportes de autores que resaltan la importancia de desarrollar esta línea de investigación, como por ejemplo (Inoue, Inoue, Matsumoto, & Akimoto, 2012); (García & Durrutya, 2009); y (Tuomilehto, Lindström, Hellmich, Lehmacher, Westermeiere, Evers, & Chiasson, 2010); no obstante, en el contexto de su predicción, aún son insuficientes los estudios, pues los profesionales de las ciencias médicas necesitan un sistema de predicción confiable para diagnosticar la DM2 (Guaya-Simbro, Ruiz, Muñoz-Meléndez & Morales, 2017).
En el estudio efectuado por (Docampo & López, 2018), se predice mediante el modelo de regresión lineal un incremento de la prevalencia total de diabetes para el año 2025 en torno al 8,5%.
Por su parte, en el año 2015, la Federación Internacional de Diabetes (IDF por sus siglas en inglés) estima una alarmante cifra de 415 millones de personas con DM (Mendoza, Pradón, Cossío & Orozco, 2018), con un dramático pronóstico de incremento en los años venideros hasta llegar a 642 millones en el año 2040, a pesar de que 192 millones de personas con DM (46,5 %) no han sido diagnosticados todavía.
Esta situación evidencia la necesidad de continuar realizando estudios sobre pronósticos de la DM para estar prevenidos ante este síndrome heterogéneo y así poder accionar ante el mismo.
De acuerdo con Medina et al. (2002), múltiples fenómenos se han analizado relacionando variables a través del tiempo, como la política y la economía, entre otros, pero los autores del presente estudio consideran que aún se requieren muchos más estudios del nivel predictivo en el campo de las ciencias médicas, dado que gran parte de sus investigaciones y las decisiones clínicas asociadas a este sector, se apoyan en análisis estadísticos como el presente (Lam, 2018), donde independiente al nivel de predicción, la simple intención de precisar escenarios de actuación futura en la toma de decisiones médicas, posibilita prevenir cualquier evolución del paciente (Vega y Comas, 2017).
Limitaciones de este estudio
Como limitaciones del estudio puede mencionarse que en esta ocasión no se tienen en cuenta otras variables independientes (exógenas) que también los antecedentes investigativos evidencian su asociación con la DM2, como por ejemplo: enfermedad isquémica coronaria o vascular de origen ateroesclerótico; bajo peso al nacer o macrosomía, sedentarismo, tabaquismo, obesidad, alcoholismo, entre otras.
Conclusiones
Se logró predecir la probabilidad de que la población de un Consultorio Médico en Matanzas, Cuba, se enferme de DM2, evidenciándose que quienes tuvieron la predisposición genética y la HTA tuvieron más riesgo de enfermar de DM2, respecto a los que no la tuvieron, por lo que se cumplieron las hipótesis de los investigadores (H1 y H2).
En las variables edad y sexo, sus relaciones con la DM2 no fueron significativas, a nivel bivariado.
La regresión logística binaria, más que una prueba estadística, es una técnica estadística que posibilita encontrar el riesgo multivariado y la significancia estadística multivariada que pueda orientar la investigación en búsqueda de la verdadera causa de la enfermedad a nivel explicativo o también para predecir la ocurrencia de la enfermedad en los estudios de nivel predictivo.
Se evidenció que la regresión logística es muy útil en su aplicación a distintas esferas de la investigación dentro del campo de las ciencias médicas cuando se requiere definir el efecto de un grupo de variables, estimadas potencialmente influyentes, sobre la ocurrencia de un proceso específico.