Estimado Sr. Editor:
He leído con interés el estudio de Font-López et al.1 sobre la validez de la glucemia en ayuno en el diagnóstico de diabetes gestacional (DG) en el primer trimestre del embarazo. Una investigación sin dudas necesaria para la búsqueda de estrategias sencillas, poco costosas y fiables en el diagnóstico de esta condición. Sin embargo, quisiera acotar algunos aspectos que reducen la calidad de los resultados y de las conclusiones presentadas.
1. Diseño del estudio: el diseño de casos y controles tiende a sobrestimar la calidad o validez de una prueba diagnóstica debido a que se introduce un sesgo importante en la selección de los pacientes. Por ejemplo, en la investigación mencionada los pacientes con DG representan el 50 % de la muestra, cuando la prevalencia de esta condición en toda la población estudiada es del 5 %. Esto afecta de manera significativa a los valores predictivos positivo (VPP) y negativo (VPN) estimados en el estudio. Si se aplicara el teorema de Bayes considerando la prevalencia real como la probabilidad a priori de la enfermedad, entonces los resultados serían VPP = 41,7 % y VPN = 98,3 %, muy distantes a los reportados por las autoras de VPP = 93 % y VPN = 75 %. De esta forma, el estudio diseñado da una falsa idea de la utilidad predictiva del test empleado, que es lo que realmente interesa en la práctica clínica2. Algunos autores sugieren que el diseño de casos y controles sea empleado en investigaciones preliminares o exploratorias, donde no se incluyen casos dudosos o complicados y que solo persigan como objetivo documentar que la prueba diagnóstica da resultados diferentes en ambos grupos, con y sin la condición de interés3,4.
2. Inconsistencias en los datos: los cuadros 1 y 2 del mencionado estudio presentan diferencias según su estratificación por glucemia en ayunas. Por ejemplo: en el grupo con < 92 mg/dL se reportan 258 pacientes en el cuadro 1 pero en el cuadro 2, los cálculos revelan a 262 gestantes.
3. Limitaciones en el procesamiento y análisis de los datos: las autoras emplean un punto de corte prestablecido, fundamentado bajo el análisis crítico de la literatura académica internacional sobre el tema. Sin embargo, esto limita significativamente la posibilidad de encontrar otros puntos de corte más adecuados a través de metodologías más precisas como la determinación del área bajo la curva ROC. Este proceder estadístico se basa en que la sensibilidad y especificidad son interdependientes en un test donde la variable predictiva es cuantitativa; esto significa que cuando uno de los indicadores aumenta el otro disminuye y viceversa. En el caso de interés, un punto de corte de glucemia muy alto, reduciría la sensibilidad ya que se subestima el riesgo de desarrollar la enfermedad con valores inferiores al seleccionado. Por su parte se elevaría la especificidad, puesto que las pacientes que se propongan positivas en el test, realmente tendrán la enfermedad, reduciéndose el número de falsos positivos5. Esto podría estar ocurriendo para las pacientes normopeso y sobrepeso como lo muestran los resultados recalculados para sensibilidad y especificidad.
Apoyando lo anterior, a pesar de que en el último párrafo de la discusión se da una descripción optimista de los valores de sensibilidad y especificidad estratificados según el estatus ponderal de las pacientes, el análisis y conclusiones que se derivan no aportan toda la información sobre el tema, con inconsistencias. Por ejemplo, la sensibilidad recalculada a partir de los datos mostrados en el cuadro 2 de las autoras para el grupo con sobrepeso (25,1-30 kg/m2) es de tan solo 50,6 % lo que contrasta con el valor reportado en la discusión de 72 %, el mismo que realmente coincide si se unen en un grupo tanto a las pacientes sobrepeso y las que tienen obesidad. Esto conllevaría erróneamente a plantear que la sensibilidad de la glucemia en ayunas aumenta en pacientes con sobrepeso u obesidad para detectar DG en las pacientes evaluadas (como se deja entender en las conclusiones), cuando realmente entre el grupo normopeso y sobrepeso, apenas si hay diferencias significativas.
4. Sugerencias finales: la calidad de un estudio de precisión diagnóstica depende de muchos factores, entre los que se citan la validez del diseño metodológico, el análisis e interpretación de los resultados y la aplicabilidad o alcance de los mismos2. La investigación analizada puede considerarse de nivel exploratoria en la población objetivo, con una aplicabilidad limitada y problemas en su diseño y análisis; sin embargo, podría mejorarse y extenderse a indagar cuáles son los puntos de corte más adecuados para la glucemia en ayunas estratificando según el IMC y otros factores de riesgo mayores para DG. Esto podría lograrse a través de un análisis de curvas ROC para cada estrato de interés. Posteriormente podrían obtenerse más evidencias de la calidad diagnóstica de los puntos de corte seleccionados si se realiza un estudio de validez retrospectivo, incluyendo una proporción de pacientes similar a como se presentaron en condiciones reales según cada estrato de riesgo3. Existen algunas herramientas que podrían guiar a las autoras y editores en la autoevaluación y mejora de este tipo investigaciones, como es QUADAS 26.
Atentamente
Dariel Díaz Arce. Magíster en Ciencias del Laboratorio Clínico. Director Área de Ciencias Experimentales. Unidad Educativa Santana. Cuenca, Ecuador.