Lectura crítica de investigación en educación
La medicina basada en evidencias1 se fundamenta en la lectura crítica de los informes de investigación médica (LCIIM) publicados, lo que ha refinado su evaluación y permite al lector seleccionar los pertinentes para su conducta médica.
El abordaje se realiza a través de guías, que facilitan su análisis metodológico y la conformación de Journal Clubs2. En México, Viniegra la introdujo en especialidades médicas, internado de pregrado y estudiantes de medicina. Paralelamente se investigó el desarrollo de la LCIIM en diferentes grados académicos, la elaboración de instrumentos válidos y confiables para su medición y la evaluación de estrategias educativas para su aprendizaje con resultados adecuados3-5.
Estos se consolidan con una formación docente paralela, en una visión diferente de la educación médica, con énfasis en la investigación y que pondera la experiencia en estrategias educativas consecuentes para su aprendizaje6.
Por lectura crítica (LC) se entiende, una capacidad que, para estar suficientemente desarrollada, supone en el lector una predisposición «casi automática» de hacer consciente, ante la proximidad de una lectura, su propia postura sobre el tema -con grados variables de conocimiento, reflexión y elaboración-, la misma que será confrontada con lo expresado en el texto; el debate constante con el autor le hace posible al lector descubrir los supuestos implícitos, la idea directriz (articuladora) y analizar los puntos fuertes y los débiles de los principales argumentos del escrito; de esta manera puede proponer otros planteamientos que superen los del autor y reafirmar o modificar su postura previa.
La LCIIM tiene tres componentes que se refieren brevemente, con algunos ejemplos de investigación educativa: la interpretación, con reconocimiento del tipo de estudio, diseño e identificación de características del instrumento y desciframiento de tablas y gráficas. Enjuiciar se relaciona con distinguir entre los puntos débiles y fuertes de las estrategias y estadísticos utilizados y proponer, son proposiciones de procedimientos que superen a los planteamientos del autor7.
El número de publicaciones científicas hace imposible su abordaje por lo que se han utilizado guías de evaluación en investigación empírica8,9 que se han consolidado en el análisis de los distintos diseños como CONSORT, TREND, STROBE, QUORUM Y PRISMA10-12.
Nos hemos referido hasta ahora a la LCIIM, cuya implementación, desafortunadamente, aún no está generalizada en las diferentes instituciones formadoras de médicos. Esta surge de una visión educativa inquisidora, o participativa, contraria a una mirada tradicional, aquiescente, y de la idea de conocimiento que cada una contiene, es decir elaboración versus consumo de información. La LCIIM difícilmente se desarrolla en ambientes ajenos a la autonomía del aprendizaje y sin estrategias que promuevan la elaboración del conocimiento13.
Definición de las particularidades de la investigación en educación médica, en contraste con el resto de literatura biomédica
La investigación en educación médica (IEM) es escasa en México y su ejercicio -paradójicamente- es una actividad ajena a los entornos educativos14,15. Sus resultados no se utilizan para mejorar los procesos educativos que exploran. En este contexto la IEM se encuentra aún menos expuesta a la lectura crítica, por lo que se pueden observar deficiencias en artículos publicados de intervenciones educativas, por lo menos en indagaciones realizadas analizando sus títulos y resúmenes16, sin embargo, debiera seguir la evolución que hemos referido brevemente con LCIIM.
Para ello es necesaria la formación en investigación y especialmente de la lectura crítica en los currículos universitarios17, así como la formación docente en IEM para valorar el rigor metodológico de los artículos publicados y ponderar la pertinencia de su implementación y, a través de preguntas de investigación adecuadamente planteadas, diseñar investigaciones educativas propias que superen los problemas del entorno, fundamentadas con evidencias educativas18.
La educación basada en evidencias es el medio para mejorar la educación médica en los innumerables aspectos susceptibles de investigar: currículo, estrategias educativas, evaluación, entre otros.
Aplicabilidad de esquemas «convencionales» para la evaluación crítica de la investigación
En relación con lo anterior los esquemas utilizados en la LCIIM pueden adaptarse para su uso en la IEM. Los diseños más frecuentemente abordados en nuestro medio se refieren a la construcción y validación de instrumentos, encuestas descriptivas y comparativas, transversales y longitudinales, intervenciones educativas y los metaanálisis, aún menos frecuentes. Algunos autores incluso recomiendan diseños sintéticos educativos19-21.
Recomendaciones prácticas para la lectura de investigación en educación médica
Como se refirió antes, una producción elevada de publicaciones condujo a facilitar su lectura con guías o lineamientos para reportes educativos22.
Para facilitar el análisis y crítica de artículos de IEM se presentan tres guías, muy básicas, de los diseños educativos más frecuentemente publicados en nuestro medio, que pueden ser útiles en esta actividad. Son, además, los diseños que el autor ha utilizado. Sin embargo, las guías no sustituyen la formación teórica continua y desafiante del lector en estos aspectos.
En los reportes de IEM es transcendental identificar la postura -generalmente implícita-de los autores. Esta se entiende como «…asumir puntos de vista propios acerca del porqué de una situación problema (educativa) de qué hacer y cómo actuar para atenuar o acrecentar sus efectos y procurar su eliminación o permanencia», es decir, su mirada educativa23.
Elaboración de instrumentos
Estos artículos24 se refieren a los que se construyen por los autores y aquellos importados de otros ámbitos. Ambos siguen un procedimiento riguroso en su validación25. En los primeros, se indaga la referencia a la validez (medir lo que pretende medir) ya sea intrínseca (teórica, constructo, contenido) y extrínseca (concurrente y predictiva). Se explora asimismo la postura, que le confiere validez teórica en las mediciones que se pretenden realizar, incluyendo el propósito u objetivo del estudio, que deben estar claramente referidos26. La bibliografía seleccionada desvela la postura educativa. Posteriormente revisamos la validez de contenido con la inclusión de los aspectos relevantes que conforman los distintos indicadores, ameritando o no un equilibrio. Es crucial evaluar la adecuación gramatical del instrumento, así como la experiencia del autor principal y expertos invitados para su validación. El número de estos puede variar, pero se aconseja contar, por lo menos, con cinco o seis evaluadores. Enseguida hay que revisar el procedimiento de validación, idealmente con la técnica Delphi (paso fundamental)27. A continuación se evalúa el formato de respuestas propuestas, generalmente una escala de Likert, aunque se adecua a la indagación deseada. Posteriormente se buscan las modificaciones sugeridas y realizadas al instrumento y las respuestas consideradas correctas por los expertos, si este fuera el caso, con acuerdo por lo menos de 5/6 o 6/6, equilibradas con las incorrectas y deben equilibrarse. El procedimiento de calificación debe detallarse así como la obtención de los resultados y diferentes estratos con sus intervalos, si fuese necesario. El enmascaramiento de quienes aplican y califican el instrumento debe referirse. Es importante indagar las características de la población o los grupos naturales en la aplicación, y en estos últimos el tamaño muestral pasa a un segundo término, ya que aunque algunos autores recomiendan seleccionar entre 5 y 10 respondedores por reactivo indagado, en general no cuentan con ese número de alumnos. Una vez analizados estos aspectos los autores deben referir la aplicación a un grupo piloto de alumnos semejantes a los que se aplicará finalmente el instrumento. Con ello se intenta su comprensión adecuada, además de la validación por expertos. Es necesario analizar el contexto en el que aplica el instrumento: lugar, horario, tiempo y aceptación para su resolución, si esta influye en la calificación final, etc. Si el instrumento no forma parte del curso regular, proporcionar los resultados individuales o grupales.
De acuerdo al propósito, algunos autores refieren la comparación con otros instrumentos ya validados (validez concurrente) o predicen un resultado (validez predictiva).
Después de la aplicación y calificación se indaga cómo se determinó la consistencia, ya sea con el alfa de Cronbach, en tres o más opciones de respuesta o la fórmula 21 de Kuder-Richardson en dicotómicas28. Es adecuado buscar otros procedimientos como el test-retest o la partición del instrumento en mitades.
Cuando evaluamos la adaptación cultural o local de un instrumento importado y validado en su contexto, se revisan los aspectos referidos y se agregan otros como la traducción del idioma original al español y a la inversa, por expertos.
Las pruebas estadísticas utilizadas se valoran también. En educación generalmente se utilizan variables cualitativas por lo que los estadísticos no paramétricos son los más utilizados y dependen de las variables estudiadas29.
Se espera que los resultados puedan ser claros y de acuerdo al objetivo del estudio. La discusión debe señalar las limitaciones del estudio, así como sus fortalezas y debilidades. Una muestra, si no el instrumento completo, debe anexarse para su análisis.
Es frecuente que muchos artículos publicados omitan algunos de los pasos referidos lo que traduce una validez y consistencia insuficientes que afectan los resultados y la aplicabilidad de ese instrumento particular (Tabla 1).
1. Introducción (postura) |
2. Objetivo |
3. Validez |
a) Teórica |
b) Contenido |
c) Predictiva |
d) Concurrente |
4. Técnica Delphi |
5. Calificación |
6. Prueba piloto |
7. Población |
8. Enmascaramiento encalificación |
9. Consistencia |
a) Alfa de Cronbach |
b) Kudder-Richardson |
c) Test-retest |
10. Resultados en cuadros y/o gráficas |
11. Comentarios |
Derivados de resultados |
a) Fortalezas |
b) Debilidades |
c) Aplicabilidad |
Intervenciones educativas
Son los artículos que evalúan estrategias educativas y en ellos se deben buscar ciertas características que les confieran validez30. La postura se infiere en los antecedentes y le confieren la validez teórica, que se manifiesta en la estrategia y traduce la relevancia y trascendencia del estudio: desarrollar habilidades complejas o memorizar conceptos a corto plazo en alumnos, por ejemplo. Se analiza la operacionalización de la variable dependiente (aprendizaje, desarrollo, etc.), la escala de medición y el instrumento propuesto (válido y confiable) y los criterios para su calificación y ceguedad.
La conformación de los grupos (dos o más) es imprescindible, por aleatorización versus grupos naturales. Sus características se detallan para identificar posibles sesgos (calificaciones, género, escuela de procedencia, medio socioeconómico, p.ej.).
En los grupos se exploran las intervenciones educativas (variable independiente) a contrastar: duración, elaboración de tareas, experiencia docente, impacto en la calificación del alumno, entre otras, y las variables contextuales (ambiente educativo, aula, auditorio, permiso para asistencia, etc.). Se analizan pérdidas de alumnos y sus motivos, si ocurren.
Los estadísticos no paramétricos se fundamentan: entre dos grupos, inicio y término de las estrategias (U de Mann-Whitney) o más grupos (Kruskal-Wallis). Cambios intragrupales, inicio y término (Wilcoxon) o correlación de variables (S de Spearman).
Los resultados se expresan claramente en cuadros, gráficas y/o figuras. La discusión se relaciona con los resultados obtenidos, sin serendipia. Se refieren las limitaciones del estudio, debilidades y fortalezas (Tabla 2).
1. Introducción (postura) |
2. Objetivo |
3. Definición operacional de variables |
a) Independiente (maniobra educativa) |
b) Dependiente (resultado) |
c) Confusoras (profesor, alumno, contexto) |
4. Conformación de los grupos |
a) Aleatorización |
b) Quasiexperimento |
5. Instrumentos |
a) Validez referida |
b) Consistencia referida |
6. Medición inicial y final (mínimo) |
a) Se define el contexto y |
condiciones de medición |
7. Estadísticos pertinentes |
a) Paramétricos |
b) No paramétricos |
Se fundamenta adecuadamente su uso |
8. Resultados en cuadros y/o gráficas |
a) Claros, con valores de p o IC |
9. Comentarios |
a) Derivados de los resultados |
b) Refiere fortalezas y debilidades |
c) Aplicabilidad |
Encuestas
También se valora la postura en la introducción. El objetivo se expresa claramente (con frecuencia es confuso). Se revisa la variable dependiente, bien operacionalizada, el instrumento (válido y confiable), su calificación y contexto de aplicación, referido antes. Además se indaga quién, cómo y cuándo se aplica, así como quién y cómo lo califica (enmascaramiento).
Se explora si se aplicará a un grupo o más, transversal o longitudinal, así como el tamaño muestral de los grupos y sus características sociodemográficas, de acuerdo al propósito del mismo, pues se identifican más fácilmente las variables confusoras.
Los estadísticos paramétricos o no paramétricos se relacionan con la escala de medición de la variable dependiente y los segundos se han referido en el diseño previo.
Los resultados, los cuadros y gráficas deben elaborarse con claridad. La discusión se fundamenta en los resultados y refiere las limitaciones, fortalezas y debilidades del estudio (Tabla 3).
1. Introducción (postura) |
2. Objetivo |
3. Variable dependiente |
a) Definición operacional |
b) Escala de medición |
4. Instrumentos |
a) Validez referida |
b) Consistencia referida |
5. Población |
a) Grupos naturales |
b) Selección y tamaño muestral |
6. Aplicación |
a) Contexto |
b) Control de sesgo (entrevistador/alumno) |
7. Medición |
a) Calificación ciega |
8. Estadísticos pertinentes |
a) Paramétricos |
b) No paramétricos |
c) Se fundamenta su uso |
9. Resultados en cuadros y/o gráficas |
a) Claros, bien construidos |
10. Comentarios |
a) Derivados de los resultados |
b) Refiere fortalezas y debilidades |
c) Aplicabilidad |
Revisiones sistemáticas y metaanálisis
Cada vez más se utilizan estos diseños y también se han construido diferentes índices cualitativos para su evaluación31. Se publican poco en nuestro país, pero sustentan de manera más adecuada la educación basada en evidencias32. No se abordan en este reporte.
Conclusiones
La educación predominante en nuestro país no utiliza a la LCIIM o la de IEM como herramientas de aprendizaje aunque no difieren metodológicamente.
Es posible utilizar guías para evaluar las publicaciones en IEM pero esta actividad no sustituye la formación teórica, permanente, desafiante y continua del lector.
Sin profesores que critiquen y realicen IEM de calidad no podemos esperar alumnos, futuros docentes, que enfrenten sus problemas educativos con educación basada en evidencias.