Señor editor: La formación de recursos humanos de alta calidad en las especialidades médicas es de gran importancia para la sociedad. El proceso inicia cada año con la selección de los candidatos a través del Examen Nacional para Aspirantes a Residencias Médicas (ENARM). En 2016, más de 36 000 médicos generales compitieron a través del ENARM por una de las, aproximadamente, 8 250 plazas ofertadas. Según fuentes oficiales, algunos de los atributos conferidos al proceso del ENARM incluyen “equitativo”, “transparente”, “objetivo” y “válido”.1
El ENARM se compone de 450 reactivos de opción múltiple y se aplica en diferentes ciudades del país y en días consecutivos. Cada día se utilizan reactivos distintos “con las mismas características de objetividad, calidad, balance y nivel académico”,*,1 “constituyendo cada versión [del examen] con el mismo número de reactivos y con la misma proporción de 50% de ítems de media dificultad y 25% para los de alta y baja, respectivamente”.‡ El diseño de los reactivos es realizado por “al menos ocho profesores expertos, quienes participan conforme a perfiles específicos” en diferentes etapas del proceso.*,1 La dificultad de los reactivos es determinada “con base en la tasa de respuestas [de cinco expertos clínicos] y su experiencia”.‡ Tras haberse aplicado todos los exámenes, los puntajes se agrupan por especialidad y se selecciona a los sustentantes de acuerdo con su puntaje hasta que se cumple con un cupo.2 El criterio primario utilizado para seleccionar a los sustentantes es el porcentaje de respuestas correctas (PRC): número de respuestas correctas dividido entre 450. En caso de empate, se consideran sucesivamente el puntaje en medicina interna, pediatría, gineco-obstetricia y cirugía y, finalmente, el grado de dificultad de los reactivos respondidos de forma correcta.2
Por la trascendencia del ENARM y los recursos económicos que genera -aproximadamente, 108 millones de pesos por cuotas de inscripción en 2016-, el ENARM debería desarrollarse con los más altos estándares de calidad.3,4 Sin embargo, existen características en su diseño y forma de evaluación que ponen en duda algunos de sus atributos (equidad, validez y confiabilidad). Como ejemplo, en el XL ENARM se encontró: a) que no existe un reporte técnico de su elaboración;‡,3 b) que no participa un editor profesional;‡,3 c) la inexistencia de prueba piloto de los reactivos en la población blanco;‡,3 d) la asignación cuasi-arbitraria del grado de dificultad de los reactivos sin utilizar teorías psicométricas;‡,3,4 e) la calificación del examen con el PRC (considera a los reactivos como iguales a pesar de que tienen una dificultad diferenciada); f) que no se calcula el error estándar de la medición,4 y g) que se compara a los sustentantes utilizando el PRC sin utilizar procesos de equiparación de pruebas,‡ a pesar de que se utilizan distintos reactivos cada día, lo que constituye la mayor amenaza contra la equidad del ENARM.3
Estas áreas de oportunidad§ deben atenderse por las autoridades respectivas para el beneficio de los involucrados, particularmente al considerar que la estructura y convocatoria del próximo XLI ENARM (septiembre 2017) son similares a las del XL ENARM.*,1