1. Introducción
La construcción de una base sólida para un desarrollo saludable durante los primeros años de vida es requisito fundamental tanto para el bienestar individual como para la productividad económica, las comunidades exitosas y las sociedades civiles armoniosas1. La arquitectura del cerebro en desarrollo se construye a través de un proceso que inicia antes del nacimiento, continúa en la edad adulta y se establece como base, ya sea fuerte o frágil, para la salud, el aprendizaje y la conducta posterior2.
Durante los primeros 5 años de vida acontece una sucesión de periodos sensibles, cada uno relacionado con la formación de circuitos que se asocian con habilidades específicas. Así, las funciones cerebrales tienen un periodo crítico de máximo potencial de desarrollo en función de la edad. El nivel de desarrollo alcanzado depende de la interacción de los genes y las experiencias tempranas3. Con base en lo anterior surgió el concepto de desarrollo infantil temprano (DIT), que abarca desde el embarazo y hasta los 6 años de edad y es un proceso de cambio en el que el niño aprende a dominar niveles siempre más complejos de movimiento, pensamiento, sentimientos y relaciones con los demás. Se produce cuando el niño interactúa con las personas, los objetos y otros estímulos en su ambiente biofísico y social, y aprende de ellos4.
Mientras el cerebro en maduración se especializa en asumir funciones cada vez más complejas, también se vuelve menos capaz de reorganizarse y adaptarse a nuevos retos. Una vez que el circuito se ha instalado, se irá estabilizando con la edad, dificultando su alteración posterior. Aunque las ventanas de oportunidad pueden permanecer abiertas por muchos años, modificar la conducta o construir nuevas habilidades sobre la base de circuitos cerebrales que no fueron debidamente instalados cuando se formaron por primera vez requiere de mucho más trabajo; además, se necesitan cantidades mayores de energía metabólica para compensar funciones de circuitos que no se desempeñan de la manera esperada5. Hacer las cosas de forma correcta desde la primera vez, en lugar de esperar y tratar de arreglarlas después, es menos costoso tanto para los individuos como para la sociedad en general2. Por esto, se debe vigilar la correcta formación de dichos circuitos.
La evaluación del desarrollo infantil es un proceso destinado a conocer y cuantificar el nivel de maduración alcanzado por un niño comparado con su grupo de edad6, lo que permite identificar alteraciones y establecer un perfil individualizado sobre las fortalezas y debilidades de los diferentes dominios evaluados. La detección temprana de problemas en el desarrollo es de suma importancia para el bienestar de los niños y sus familias, ya que permite acceder a un diagnóstico y tratamiento oportunos7, y llevar a cabo acciones dentro de las ventanas de oportunidad para evitar la consolidación de circuitos inadecuados y favorecer que estos se reorganicen de una forma óptima. Estas acciones dan pie a que los niños y niñas puedan desarrollar habilidades cada vez más complejas acordes con su edad, y así alcanzar su máximo potencial.
El juicio clínico del personal de salud no es suficiente para realizar esta evaluación e identificar pacientes con retraso del desarrollo. De ahí la importancia de emplear herramientas estandarizadas para detectar a estos pacientes8. Una prueba de tamiz es una herramienta que tiene como función identificar individuos presuntamente enfermos en una población aparentemente sana al establecer el riesgo o sospecha de un problema de desarrollo. Se debe actuar cautelosamente al utilizar un instrumento, por el riesgo de efectuar mediciones que no coincidan con la realidad, y retrasar una intervención a quien sí lo requiere.
Antes de incorporar una prueba de este tipo como parte de la práctica clínica rutinaria es necesario certificar que tiene ciertas características que hacen meritoria su utilización. A este proceso de certificación se le denomina validación de pruebas9. Existen varios procesos que se han considerado como validación sin que en realidad lo sean. Los más frecuentes son efectuar únicamente traducciones, solamente realizar pruebas de concordancia o correlación con los resultados de la medición de otro instrumento o practicar tan solo pruebas de concordancia entre diferentes evaluadores10.
El objetivo de este artículo fue describir los pasos que se llevan a cabo para la validación de pruebas de tamiz (Tabla 1), utilizando como ejemplo el proceso del desarrollo de la versión modificada, validación y evaluación en campo de la prueba EDI. Estos pasos deben responder una serie de preguntas que a continuación se exponen.
La escala que se va a utilizar debe ser la mejor disponible. Por ello, es importante analizar previamente si existe un instrumento que cumpla con el objetivo que se desea alcanzar10. En el caso de pruebas de tamiz de desarrollo infantil en México, ante el interés de contar con un instrumento validado para la detección oportuna, se realizó una revisión sistemática basada en la información disponible en bases de datos y motores de búsqueda de publicaciones científicas11. No se encontró en la literatura científica información sobre alguna prueba de tamiz validada en México. Por otro lado, las pruebas disponibles en América presentaban deficiencias o características diferentes que no las hacían las más adecuadas para su implementación en México. Como parte de la NOM-031-SSA1-1999, Para la atención a la salud del niño12, el punto 9.6.1 especifica que la valoración del desarrollo psicomotor del niño se debe realizar cada vez que el niño acuda a consulta para control de la nutrición y crecimiento, utilizando como referencia los límites de normalidad de conductas especificados en el apéndice F del mismo documento. No se encontró información disponible acerca de los valores de la prueba contenida en este apéndice (sensibilidad/especificidad) ni sobre el proceso de validación aparente o de criterio, además de que, como resultado de la prueba, solo se reporta si el niño fue identificado como con alarma. Debido a estos datos se concluyó que "no existe un acuerdo sobre cómo evaluar el desarrollo físico, cognitivo, social y emocional de los niños en México. Los datos que se utilizan para medirlo son la matrícula de niños y niñas en educación preescolar o su inscripción en programas de cuidado" 4.
Si se planea diseñar una nueva herramienta, ¿qué funciones clínicas debe cumplir y como estaría estructurada?
La herramienta que se requería en México debía cumplir con las siguientes funciones clínicas:
Caracterización cualitativa del nivel de desarrollo de los niños. Identificación de cambios a través del tiempo que permitan realizar intervenciones adecuadas a las necesidades de los niños.
Servir de base para una guía de manejo.
A falta de pruebas que cumplieran con estas funciones, la Dirección General del Programa Oportunidades (hoy PROSPERA), en 2010, solicitó a la Dra. Lourdes Schnaas, del Instituto Nacional de Perinatología, el diseño de la prueba de tamiz Evaluación del Desarrollo Infantil (EDI) en su versión original13. Esta prueba funcionaría como un instrumento para la detección oportuna de problemas del desarrollo en niños y niñas desde un mes de vida y hasta un día antes de cumplir 5 años, utilizando un sistema de calificación en semáforo: verde (desarrollo normal), amarillo (rezago) o rojo (riesgo de retraso) (Tabla 2)14.
2. Proceso de validación de una prueba de tamiz
Una vez que se ha diseñado o identificado un instrumento que pudiera ser de utilidad para cumplir el objetivo de identificar de forma oportuna la enfermedad o fenómeno de interés, la evaluación de la validez busca responder a las siguientes preguntas:
¿La escala parece medir lo que debe medir? ¿Refleja la estructura de dominios del fenómeno a evaluar?
Responder la primera pregunta es fundamental para establecer la aceptabilidad de la prueba en el escenario de aplicación, estableciendo con esto la validez de apariencia9. Esta validez depende del análisis de la apariencia de la prueba y de sus ítems en cuanto a cómo buscan evaluar el fenómeno de interés (foco en el intercambio interpersonal, en la evidencia básica, coherencia biológica de los componentes, atención a colaboraciones personales). La respuesta a la segunda pregunta supone analizar los diferentes componentes de la prueba para establecer si el instrumento refleja el concepto que se pretende medir (omisiones importantes, inclusiones inapropiadas, peso de los componentes, escalas elementales satisfactorias y la calidad de la información básica), y con esto establecer la validez de contenido.
Para responder a estas preguntas se llevó a cabo un análisis minucioso de la versión original de la prueba EDI. Se detectaron áreas de oportunidad a partir de las cuales se desarrolló la versión modificada de la misma15. Para cada una de las preguntas se desarrollaron instrucciones y criterios precisos de calificación, se reorganizaron las preguntas en ejes con características comunes, se modificaron los criterios de calificación global para mayor congruencia y se añadió la modalidad observada en los ítems que se consideraron pertinentes. Estas modificaciones se realizaron para cumplir de forma adecuada con los requerimientos de validez de apariencia y contenido (Tabla 3).
EDI: Evaluación del Desarrollo Infantil; DE: desviación estándar.
a Rizzoli-Córdoba y colaboradores (ref. 21).
b Rizzoli-Córdoba y colaboradores (ref. 15).
Una vez lograda la validez de apariencia y contenido se buscó una validación por consenso. Para este fin, se organizó un panel de expertos que analizó cada uno de los ítems de la prueba EDI, comparando las dos versiones de la prueba utilizando una metodología de panel Delphi modificado. Este panel llegó a la conclusión de que la versión modificada de la prueba EDI era el instrumento de tamiz más adecuado para la evaluación de menores de 5 años en el contexto del país16. De forma adicional, se estableció que el Inventario de Desarrollo de Battelle 2.a edición en español (IDB-2), era el instrumento más adecuado para la corroboración diagnóstica17.
Para responder esta pregunta, es necesario que las pruebas sean sometidas a un proceso de validación de criterio concurrente. Este proceso busca conocer la medida en la que coinciden los resultados de dicha prueba con las evaluaciones diagnósticas consideradas estándar de oro o con aquellas habitualmente utilizadas y consideradas de referencia18. Para ello, se requiere de un estudio que cumpla con un diseño adecuado19, considerando la calidad de la evaluación y el riesgo de sesgo20.
Un estudio de validación permite establecer la capacidad de la prueba para las siguientes características: a) identificar como anormales a las personas que tienen la enfermedad (sensibilidad); b) identificar como normales a las personas que no tienen la enfermedad (especificidad); c) conocer el porcentaje del total de personas que obtienen un resultado anormal en la prueba de tamiz en que se corrobora la enfermedad (valor predictivo positivo); y d) el porcentaje del total de personas con resultado normal en la prueba que realmente no tienen la enfermedad (valor predictivo negativo). En el caso de pruebas de tamiz, se recomienda que tengan valores de sensibilidad y especificidad mayores al 70%18.
Para conocer las propiedades de la prueba EDI en sus dos versiones (original y modificada), se llevó a cabo un estudio de validación de criterio concurrente21 frente a dos instrumentos de evaluación del desarrollo considerados como estándar de referencia: IDB-217 y Bayley-III22. Como objetivo secundario de este estudio se realizó el análisis por componentes evaluados (dominios del desarrollo) 23 y para las diferencias por resultado anormal (amarillo vs. rojo) 24. De acuerdo con el diseño del estudio y con los resultados obtenidos, y mediante un análisis comparativo de las pruebas de tamiz para problemas en el desarrollo diseñadas y validadas en México, se identificó que el estudio de validación de la prueba EDI era el que tenía menor riesgo de sesgo en los datos publicados25.
Una vez establecida la validez de la prueba, existen dos preguntas adicionales a considerar para poder llegar a contextualizar la confiabilidad de los resultados de la aplicación en campo.
¿En su aplicación en campo, se encuentran resultados similares a lo descrito en la validación de criterio?
Una vez identificadas las propiedades de la prueba en el estudio de la validación, se debe conocer si estas se mantienen en su aplicación en campo. Para conocer esto se realizó un estudio que incluyó niños de 16 a 59 meses de edad identificados con riesgo de retraso en la prueba EDI, en quienes se buscó establecer la confirmación diagnóstica de retraso mediante la aplicación de IDB-2. En este estudio se encontró que el 93.2% de los niños identificados con riesgo de retraso por la prueba EDI tuvieron diagnóstico de retraso en al menos un dominio evaluado por la prueba diagnóstica26. Este resultado fue similar al descrito en el estudio de la validación de criterio (93.8%)21, con lo que se corroboró la confiabilidad de los resultados al aplicar la prueba en campo.
¿La escala funciona bien cuando se aplica en diferentes momentos o cuando es aplicada por distintas personas?
Si un mismo paciente es evaluado al mismo tiempo por dos evaluadores diferentes, los resultados de la evaluación deberían ser similares; esto es lo que se mide con la confiabilidad interevaluador. La concordancia en el resultado de la prueba al evaluar al mismo paciente en diferentes ocasiones en un lapso corto de tiempo es lo que se denomina confiabilidad test-retest. En un estudio que tuvo como objetivo evaluar un modelo de supervisión que permitiera identificar la calidad de la aplicación de la prueba EDI a nivel poblacional, se encontró una concordancia interevaluador del 86.1% a través de la aplicación simultánea de la prueba como estudio de sombra; y una concordancia en la re-aplicación de la prueba entre el supervisor y el aplicador del 88.1%. Estas diferencias en el resultado estuvieron asociadas con la incorrecta administración de alguno de los ítems por personal específico, lo que refuerza la necesidad de acompañamiento y verificación de la correcta aplicación en campo para obtener resultados confiables27.
Para la detección oportuna de problemas en el DIT se deben plantear, como primera línea, las pruebas de tamiz que parezcan medir lo que deben medir (validez de apariencia), incluyan todos los dominios del desarrollo a ser evaluados (validez de constructo), que al compararse con las evaluaciones diagnósticas consideradas estándar de oro tengan valores de especificidad (porcentaje del total de personas con desarrollo normal por el estándar de oro que la prueba de tamiz identifique como normales) y sensibilidad (porcentaje de las personas enfermas por el estándar de oro que la prueba de tamiz identifique como anormales) superiores al 70% (validez de criterio)18; que tenga resultados similares cuando se aplique en diferentes oportunidades o por distintas personas (confiabilidad test-retest o evaluador); dado que el desarrollo infantil es un proceso de cambio, que detecte estas diferencias con el paso del tiempo (sensibilidad al cambio); y que sean rápidas y de fácil administración, para que puedan ser utilizadas por personal no especialista en las unidades de atención primaria (utilidad)28.
La evidencia disponible sobre la prueba EDI corrobora el cumplimiento de cada uno de los puntos antes señalados, por lo que es considerada actualmente la prueba más adecuada para la detección oportuna de problemas del desarrollo en México16, y es la prueba recomendada por el Centro Nacional de la Infancia y la Adolescencia para la evaluación del desarrollo infantil en las unidades de atención primaria del país29. El análisis de la información obtenida a través de su aplicación en campo permitirá identificar las áreas de oportunidad, y corroborar si los resultados de los diferentes pasos de la validación son consistentes al ser aplicada como parte de una política pública.
Financiamiento
Para este escrito no se obtuvo financiamiento.