Introducción
Las guías de práctica clínica (GPC) se consideran instrumentos útiles para estandarizar la práctica clínica y disminuir la variabilidad,1 que es un sinónimo de calidad deficiente en los servicios de salud. Por estas razones, desde que el Instituto de Medicina de Estados Unidos1 estandarizó su concepto y características,2 las GPC han suscitado un interés creciente, tanto en los proveedores de atención médica clínica como en tomadores de decisión, interés justificado por su repercusión en la calidad de la atención, control de riesgos clínicos y legales, de costos y de uso inadecuado de recursos.
Como estrategia nacional, las GPC son un elemento de rectoría dentro del conjunto de iniciativas relacionadas con la implementación de estándares y regulación de la provisión de servicios de salud.3 Pueden contribuir a la mejora de la atención, en la capacitación del profesional de salud y aumentando la efectividad, eficiencia y satisfacción con la atención prestada, lo que es una excelente estrategia organizacional de mejora. Por ello, es importante que al desarrollar las GPC se identifiquen los indicadores de evaluación, así como los elementos necesarios para su implementación, a fin de garantizar y monitorizar aplicación y utilización de las recomendaciones por los profesionales de salud.
La monitorización de la utilización de GPC es el último eslabón en la cadena de elaboración e implementación de las mismas.
El desarrollo de GPC inicia con la utilización de criterios adecuados para seleccionar los temas,4 acompañado de un proceso que produzca GPC con atributos y características de calidad, además de una evaluación sistemática antes de su publicación, y una estrategia de implementación acorde con las características del sistema, instituciones y unidades médicas en las que se pretenda implementar.5,6 La implementación esta descrita en el documento Estrategia para difusión e implantación de las Guías de Práctica Clínica en el Sistema Nacional de Salud,7 existente desde 2012, donde se da cuenta de las estrategias y acciones para realizar la implementación, mismas que están a cargo de la Dirección General de Calidad y Educación en Salud. La implementación ha sido evaluada y los resultados son diferentes por institución y, en general, poco satisfactorios.8,9,10
Evaluar integralmente las GPC, especialmente en programas oficiales como el implementado sectorialmente en México,11 debería incluir componentes para cada etapa del proceso. Sin embargo, lo común es realizar evaluaciones parciales: ya sea valorar la presencia de atributos de la calidad formal de las GPC,12 las estrategias y barreras para su implementación10,13 o en el grado de cumplimiento de sus recomendaciones.
Para este estudio se eligieron los principales diagnósticos de enfermedades crónicas no transmisibles (ECNT):14 diabetes mellitus tipo 2 (DMT2), sobrepeso/obesidad, dislipidemia, hipertensión arterial (HTA) y riesgo cardiovascular (RCV). La adecuada prevención, diagnóstico y tratamiento de estos padecimientos son determinantes para evitar daños mayores a corto, mediano y largo plazo, que redundan en alto costo para pacientes, familias, sociedad y sistema de salud en general.15,16
El estudio tuvo como objetivos: 1) evaluación de la calidad formal de las GPC para las ECNT en el primer nivel de atención (1N): DMT2, HTA y RCV, dislipidemias y obesidad; 2) identificación del cumplimiento de las recomendaciones de las GPC por los profesionales de los centros de salud (CS) de las Secretarías Estatales de Salud;2y 3) medición del conocimiento sobre las GPC y opinión del personal de salud sobre barreras y facilitadores para su utilización.
Material y métodos
Selección de GPC y evaluación de su calidad formal
Del Catálogo Maestro de GPC del Centro Nacional de Excelencia Tecnológica en Salud ‡ (Cenetec) se seleccionaron las GPC relacionadas con enfermedades crónicas aplicables al 1N, y se procedió a evaluar su calidad formal utilizando el instrumento Apraisal of Guidelines Research and Evaluation,17 segunda versión (AGREEII). Este instrumento contiene 23 ítems agrupados en seis dominios: 1) Alcance y objetivo; 2) Participación de los implicados; 3) Rigor en la elaboración; 4) Claridad de la presentación; 5) Aplicabilidad y, 6) Independencia editorial. La puntuación por dominio se expresa como porcentaje, calculado al sumar todos los puntos de los ítems incluidos en cada dominio y estandarizando el total sobre la máxima puntuación posible para ese dominio, según el número de evaluadores. Se contó con tres evaluadores independientes que aplicaron el AGREEII a las 18 GPC seleccionadas. Las calificaciones de los evaluadores se consolidaron agrupando las GPC por temática (DMT2, RCV e HTA, y dislipidemias, obesidad/sobrepeso) para comparar los resultados.
Selección de recomendaciones y construcción de indicadores
La medición del apego se realizó a través de indicadores construidos mediante el análisis de evidencias y recomendaciones contenidas en las GPC. Se utilizó el Sistema GRADE para clasificar Evidencias y Fuerza de Recomendaciones,18 o su equivalencia en el Sistema Unificado,19 para seleccionar las evidencias con alta gradación (AG: A y B1) y sus respectivas recomendaciones con mayor fuerza (A, y excepcionalmente B). Este sistema, utilizado en investigaciones previas en las que se construyeron indicadores a partir de GPC,15 es una escala consensuada para lograr una armonización en la interpretación de la evidencia, dado que diversas GPC usan sistemas de gradación diferentes. Una vez definidos los indicadores, se diseñaron instrumentos para el piloto y recolección estandarizada de datos. De las 18 GPC relacionadas con las ECNT atendidas en 1N se seleccionaron tres con base en tres criterios: población blanco, trascendencia y factibilidad de medición con indicadores de estructura, proceso y resultado.
Prueba piloto
Se pilotaron los instrumentos de recolección de datos y los indicadores construidos en un CS urbano de cuatro núcleos básicos (cada núcleo básico lo compone un médico, una enfermera y a veces un promotor de salud; tienen asignada una población de 2 500 a 3 000 habitantes). El objetivo fue completar la validación de los indicadores e incluyó confirmar los criterios señalados antes, además de la fiabilidad mediante cálculo de la concordancia interobservador por el coeficiente de Kappa.20
Después del piloto se contó con indicadores medibles, útiles y fiables, con Kappa ≥0.6, y se unificaron los criterios para medición y análisis. El trabajo de campo inició con fichas técnicas de indicadores e instrumentos ajustados.
Encuesta a profesionales
Se elaboró una encuesta para profesionales de salud para la medición del conocimiento, accesibilidad y utilización de las GPC de ECNT en 1N. Se piloteó al igual que los indicadores aplicándola a los profesionales que laboraban ese día en el CS. El instrumento definitivo se aplicó al personal profesional de los CS incluidos en el trabajo de campo.
Recolección de información en los Centros de Salud
Durante abril de 2014 se realizó la gestión con las autoridades de las entidades federativas elegidas por conveniencia para obtener su consentimiento para participar en el estudio. Finalmente, en mayo se inició el trabajo de campo en 5 CS, uno en cada estado, mismos que fueron propuestos directamente por las autoridades estatales: Querétaro, Guerrero, Hidalgo, Distrito Federal y Puebla. Tres de los CS se ubicaron en la capital del estado y los otros en ciudades de menor tamaño.
Tipo de estudio. Estudio transversal en cinco CS, con ≥5 núcleos básicos y preferentemente urbanos. Las fuentes de información fueron los expedientes clínicos (papel o electrónico) y las tarjetas de control de pacientes crónicos. La encuesta se realizó al personal médico y de enfermería de los CS.
Muestra. Se determinó con Lot Quality Acceptance Sampling (LQAS), metodología ampliamente utilizada en los servicios de salud desde los años ochenta,21 originalmente descrita por Dodge y Roming 22 y retomada por Saturno.23 Este método permite tomar decisiones con muestras pequeñas sobre aceptación de la presencia del estándar de calidad prefijado o sobre la existencia de situaciones problemáticas, aplicando la teoría de la probabilidad estadística y utilizando la distribución binomial cuando el indicador es una variable dicotómica. Se plantearon dos tipos de estándar para la determinación del tamaño de muestra: cumplimiento (buena calidad) de 75% y umbral (mala calidad) de 40%; y cumplimiento de 95% y umbral de 75%, en ambos casos con α=5% y β=10% para las decisiones sobre los niveles de cumplimiento. Utilizando la tabla de probabilidades adaptada24 de Lemeshow,25 lo requerido fueron 15 expedientes elegidos por muestreo aleatorio sistemático para cada indicador evaluado.
Análisis estadístico. Aplicando LQAS para aceptación o rechazo del cumplimiento de los estándares de calidad preestablecidos (95 y 75%), se desarrolló una matriz de análisis para estimar el cumplimiento por indicador en cada CS con cálculo de intervalo de confianza (IC) exacto binomial, y las fórmulas aplicables al muestreo estratificado no proporcional,24 para la estimación conjunta del nivel de cumplimiento en los cinco CS:
Para la estimación puntual:
Para el intervalo de confianza de 95%:
dónde:
Resultados
Evaluación de calidad de las GPC con AGREEII
Las 18 GPC seleccionadas fueron categorizadas en tres grupos: seis relacionadas con RCV e HTA, seis incluyendo dislipidemias, obesidad y sobrepeso y seis de DMT2. El cuadro I muestra comparaciones de porcentajes obtenidos, en general y por dominio del AGREEII, según grupos diagnósticos. El promedio general fue 57.4% (min. 53.6%, máx. 60.8%). El grupo mejor calificado fue DMT2, mientras que el peor fue RCV y HTA.
Elaboración propia con base en resultados de la Evaluación de la calidad formal de las GPC
ECNT: enfermedades crónicas no transmisibles
Los dominios con promedio >70%, fueron el de “Independencia editorial” (media 82%, min. 73.6, máx. 87.4) y “Alcance y Objetivos” (media 73.5%, min. 70.4, máx. 77.2). “Claridad en la presentación” alcanzó 66%, seguido por “Rigor en la elaboración” (55%), que valora el proceso para asegurar la calidad de la evidencia y la fortaleza de las recomendaciones “Participación de los implicados” 43.5%. Finalmente, “Aplicabilidad”, que entre otras cosas valora los recursos e infraestructura necesarios para la implementación, obtuvo la puntuación más baja (24.7%).
Selección de evidencias y recomendaciones para elaborar indicadores
Las GPC seleccionadas para construir indicadores fueron las de HTA, RCV y DMT2. Se construyeron 23 indicadores, distribuidos en prevención primaria, prevención secundaria y tratamiento, a partir de 63 evidencias, 73 recomendaciones y puntos de buena práctica (PBP) de AG seleccionados de 101 evidencias, 175 recomendaciones y 22 PBP. El cuadro II muestra la distribución por grupo de guías.
Elaboración propia con base en resultados de la Evaluación de la calidad formal de las GPC
GPC: guías de práctica clínica
HTA: hipertensión arterial
RCV: riesgo cardiovascular
DMT2: diabetes mellitus tipo 2
Para el trabajo de campo, después del piloto se seleccionaron tres indicadores de HTA (GPC diagnóstico y tratamiento de la hipertensión arterial en el primer nivel de atención), uno de RCV (GPC detección y estratificación de riesgo cardiovascular) y tres indicadores de DMT2 (GPC diagnóstico, metas de control ambulatorio y referencia oportuna de prediabetes y diabetes mellitus tipo 2 en el primer nivel de atención) (cuadro III).
* Prevalencia extrema e índice Kappa nulo: concordancia general cuando K no interpretable
‡ Cuando hay una prevalencia extrema de sucesos, K tiende a disminuir y se vuelve difícil de interpretar. En esos casos se valora el porcentaje de concordancia, pese a tener valor de Kappa
Elaboración propia con base a resultados de la Evaluación de la calidad formal de las GPC
GPC: Guía de Práctica Clínica
DMT2: Diabetes mellitus tipo 2
RCV: riesgo cardiovascular
IECA: inhibidores de la enzima convertidora de angiotensina
Cumplimiento de indicadores en centros de salud
Se establece la situación como problemática (no cumple el estándar de calidad) cuando no alcanza el mínimo de cumplimientos esperados, ya sea por LQAS 75/40% o LQAS 95/75%. Se presenta la proporción estimada de cumplimiento con IC95%.
En HTA (cuadro IV), el indicador “Detección oportuna de HTA” alcanzó el cumplimiento estimado más alto y superior a los otros estándares elegidos en los cinco CS, con un cumplimiento conjunto estimado de 97% (IC95%:94-100). Por el contrario, ningún CS cumple con el estándar de calidad para el indicador “diagnóstico con criterio y procedimiento correctos”. Se observaron cumplimientos por CS muy bajos y estimación conjunta de 4%. Para el indicador de tratamiento, valorable según el tipo de comorbilidad(es) presente(s) en el paciente, se encontraron muy pocos expedientes con datos, lo que impidió cálculos más específicos de LQAS por CS; el cumplimiento general fue 56% (IC95%:41-67).
* Indicador compuesto. Para LQAS: cumplimiento simultáneo de todos los sub-indicadores; Cumplimiento estimado: considerando cumplimientos específicos de todos los sub-indicadores
LQAS: Lot Quality Acceptance Sampling
IC 95%: Intervalo de Confianza al 95% exacto binomial
NA: No aplica
GPC: Guía de Práctica Clínica
RCV: riesgo cardiovascular
CS: Centro de Salud
DMT2: Diabetes mellitus tipo 2
Elaboración propia con base en resultados de la Evaluación de la calidad formal de las GPC
El indicador “Personas que han sido calificadas con RCV” (cuadro IV), que valora si se califica el RCV en pacientes con factores de riesgo claramente identificados, no obtuvo cumplimiento en ninguno de los parámetros de LQAS, estimado conjunto de 1% (IC95%:0.01-1.9).
En DMT2 (cuadro IV) el indicador con mejor cumplimiento fue diagnóstico correcto con criterios y procedimiento correctos, con 91% (IC95%:84-98), excepto uno de los CS donde no alcanzó 50% y no cumple ninguno de los estándares establecidos para LQAS. La vacunación para Hepatitis B no se encontró en ninguno de los expedientes evaluados. Las autoridades del CS refirieron que no tienen abasto de vacuna para los pacientes adultos diabéticos. En el indicador compuesto que valora el manejo farmacológico adecuado en DMT2, dependiendo de comorbilidades y complicaciones, se estimó cumplimiento conjunto de 52%; puesto que, al igual que en HTA según comorbilidades, los casos para evaluar de forma específica por CS fueron insuficientes. En general, el tratamiento de DMT2 se cumple mejor en pacientes con diabetes sin comorbilidades y sin complicaciones, y con deficiencia en pacientes con DMT2 e hipertensión. Se encontraron muy pocos pacientes con tratamiento insulínico.
Opinión de los profesionales de los CS
Se aplicaron 70 cuestionarios a profesionales de salud en los CS visitados; el cuadro V muestra los principales resultados. La mayoría coincidió en que el documento más conocido, de mayor uso, utilidad e importancia son las Normas Oficiales Mexicanas (NOM), después GPC y, por último, las Reglas de Operación de los Programas (ROP); se utilizan más las NOM (81.4%). De las GPC relacionadas con ECNT, 31% de los profesionales lograron recordar una GPC del tema de interés; las GPC de hipertensión y estratificación RCV obtuvieron 71% de “no conocimiento” (cuadro V).
Elaboración propia a partir de datos recolectados en entrevista a personal médico y de enfermería en contacto con el paciente, en cinco centros de salud del primer nivel de atención (N=70 entrevistas)
GPC: Guía de Práctica Clínica
ECNT: Enfermedades crónicas no transmisibles
Al preguntar sobre el cumplimiento de las GPC del grupo ECNT, la respuesta predominante fue “no se utilizan” (entre 44 y 46%, según GPC) y sólo 17% las utiliza siempre y casi 38% las utiliza con frecuencia. En el CS3 refirieron mayor utilización de las recomendaciones de las guías de ECNT, mostrando porcentajes para cada diagnóstico >75%, lo cual no fue consistente con la revisión de expedientes. El CS5 fue el siguiente en cumplimiento, con 63% para los tres diagnósticos. La falta de apego se aceptó en mayor proporción en el CS1.
Algunos resultados de la percepción de los profesionales son contradictorios; por ejemplo, el CS1 con el mejor cumplimiento estimado en el indicador de HTA sobre adecuación de tratamiento farmacológico según comorbilidades y complicaciones (93%) es el que presenta la opinión de uso frecuente más bajo (31%) de los cinco CS. Similar comportamiento tuvo el CS4, segundo mejor cumplimiento estimado (81%) y, en opinión de los participantes, se usan sólo 31%. En contraste, el CS5, con utilización de 63% según los profesionales, obtuvo 33% de cumplimiento estimado en el indicador evaluado.
Los profesionales entrevistados perciben que las barreras son “falta de tiempo durante la consulta” (médicos) como principal motivo de no utilización de las guías, 30%; seguido del “desconocimiento del personal de salud” acerca de las guías, 24% (principalmente enfermería).
El personal médico y de enfermería coinciden en opinar que podría mejorar la utilización de GPC si primero se capacita (42%) y después se hacen las GPC más accesibles y fáciles de manejar (33.6%). La difusión y capacitación también deben ser reforzadas, pues sólo 20% del personal de salud recordó participación en alguna actividad de este tipo en los dos últimos años.
Discusión
En relación con la calidad formal de las GPC, los resultados al aplicar el AGREEII muestran que la elaboración de las GPC en México tiene debilidades que han sido identificadas en otros contextos.12,26,27,28 La publicación de GPC incompletas, incluso con carácter oficial, es un problema básico y, desafortunadamente, en mayor o menor medida, global. El dominio de “rigor en la elaboración”, se considera medular en las guías, ya que demuestra la realización de búsquedas exhaustivas de evidencia, no sesgadas y reproducibles. En las GPC mexicanas, dicho dominio no está claramente descrito. Esto dificulta la identificación de indicadores para la monitorización del uso de las GPC, al no ser siempre posible la identificación de las recomendaciones clave, ni aquellas con el mayor respaldo documentado para ser implementadas. Otro aspecto a considerar es la fragmentación del proceso clínico de atención en diversas GPC, lo que dificulta al profesional la consulta de las recomendaciones clínicas.
Al igual que en otros ámbitos y países,12,28,29 la “participación de los implicados” debe mejorarse notablemente. Podría lograrse al integrar en la elaboración de las GPC a todos los profesionales implicados en la atención de la población blanco, un experto en metodología, pacientes y sociedad civil, así como organizaciones de interés relacionadas con la implantación. La falta de participación de todos los implicados en el proceso de atención, como proveedores y como receptores del mismo, y la consideración de sus puntos de vista y necesidades, son una barrera potencial que puede afectar la aplicabilidad, utilización y, por tanto, implementación de las GPC.
La “aplicabilidad” de las GPC es el dominio con los resultados más bajos. En la mayoría de las GPC evaluadas no se encuentra información sobre las barreras, facilitadores, recursos y costos que la unidad médica debe conocer para analizar la implementación de la guía. Esta deficiencia al elaborar las GPC se ha encontrado también en evaluaciones en otros países, donde se reportan calificaciones tan bajas como 8% en guías para la atención de hipertensión aguda, o para tratamiento del control glicémico en DMT2.29,30
Conocimiento y apego a las GPC
Algunos estudios señalan que la calidad de las GPC es, por sí misma, uno de los factores que afectan su utilización.10 La falta de apego a las GPC se ha reportado previamente en estudios en México y otros países, y para varios tipos de patologías, especialmente la crónica.8,31,32 carotid Doppler ultrasound and echocardiogram Probablemente la explicación es multifactorial y contextualizada,33 pero se señalan como factores críticos la comunicación, diseminación e implementación, incluida la investigación sobre opciones más efectivas para utilizar las recomendaciones de las GPC.34 También se concluye que múltiples estrategias son más efectivas que aplicar sólo una para lograr la adherencia a las GPC.10,35
Los resultados acumulados de los cinco CS en el cumplimiento de los indicadores de DMT2 mostraron que no se aplican las recomendaciones de las GPC, ya sea por desconocimiento del personal de salud o porque existen importantes barreras para su aplicación en consulta.
Lo primero que destaca en este estudio, en lo expresado por los profesionales entrevistados, es el desconocimiento de las GPC evaluadas; probablemente se entremezcla con la confusión creada por la coexistencia de GPC, NOM y ROP, que abordan temas semejantes pero cuyas recomendaciones no siempre coinciden.6 Se confirmó que las NOM son más conocidas y son prioritarias a las GPC, lo que coincide con el valor legal de las NOM.
El escaso apego a las GPC apunta lógicamente a deficiente implementación, ya señalado en lo relacionado con “aplicabilidad”, falta de adaptación local, de estudios de costos para el cumplimiento de recomendaciones, así como de indicadores para monitorización de su utilización, resultados e impacto.10,36 Sin estrategia clara de implantación ni medición sistemática del apego difícilmente se realizarán las acciones de retroalimentación que permitan trabajar con las barreras existentes, similares probablemente a las encontradas en otros sistemas de salud.35,37 Las acciones relacionadas con las estrategias de implementación como las características de las GPC, de los profesionales, los pacientes a los que se aplicarán y del entorno laboral,13,35 deben medirse y entender su importancia relativa y abordaje estratégico en cada país y entorno concreto, siempre en relación con los principales problemas de salud a atender.35,38
Existe una sobreestimación en general, aunque con excepciones, sobre el uso de las GPC que realizan los profesionales, que puede originarse, en parte, por la confusión entre documentos ya mencionada, pero también y de forma general con la sobreestimación de las buenas prácticas cuando se pide la opinión de los profesionales, algo bien establecido por investigaciones anteriores en otros países.39 No obstante, casi 45% opinó que las GPC no se utilizan. Las cifras son semejantes a lo encontrado en el Instituto Mexicano del Seguro Social (IMSS), en un estudio realizado en los tres niveles de atención,8 donde se señala que 65% de los profesionales encuestados reportó utilizar las GPC.
Las principales barreras para la utilización de las GPC, y por tanto los posibles focos para diseñar intervenciones que favorezcan su uso, coinciden en gran medida con lo reportado internacionalmente.13,35 Se señalan como relevantes problemas de accesibilidad a los documentos, necesidad de capacitación sobre su contenido y uso, y los problemas de personal y tiempo necesario para su implementación. El hecho de que estos mismos problemas sean comunes y persistentes en diversos contextos y países denota que la atención prestada a las GPC sigue estando enfocada principalmente a su elaboración, pero que la estrategia de implementación con el manejo de las actitudes de los profesionales, las cuestiones de organización y contexto en donde se aplicarían sigue pendiente.
En el trabajo clínico del personal de salud, las GPC no han logrado el beneficio de contribuir a una atención médica segura, efectiva y eficiente. Se puede concluir que para mejorar y fortalecer las GPC en México podrían realizarse las siguientes acciones:
Evaluación explícita y rutinaria de las guías antes de publicarlas, para mejorar su calidad formal.
Revisar las guías existentes, actualizar priorizando por tema, incluir recomendaciones clave e indicadores de cumplimiento.
Incluir estrategia de implementación (aplicabilidad) en las GPC, tener en cuenta las barreras en el diseño del plan. Armonizar con las NOM y otros documentos con recomendaciones clínicas.
Incluir evaluación de la estrategia de implementación y cumplimiento de recomendaciones clave, para poder valorar qué aspectos de la estrategia y de la calidad de la atención han de ser mejorados.
La fortaleza de este estudio es la carencia en el ámbito nacional de evaluaciones integrales de GPC como la que se realizó en esta ocasión; se espera poder realizar un estudio similar, en más unidades médicas y en los tres niveles de atención. El impacto de estos resultados se vería claramente si se atienden las áreas de oportunidad identificadas en este estudio, y sea posible mejorar las actividades médicas y del personal de salud del 1N en el sistema de salud mexicano.
Las limitaciones de este estudio son en cuanto a que los resultados no se pueden extrapolar a todos los CS del país, y las deficiencias del expediente clínico y los registros de pacientes crónicos no permiten realizar una evaluación con más indicadores.