Introducción
La inseguridad alimentaria (IA) se define como “la disponibilidad limitada o incierta de alimentos nutricionalmente adecuados e inocuos, o la capacidad limitada e incierta de adquirir alimentos adecuados en formas socialmente aceptables”.1 Según los reportes del estado de seguridad alimentaria de la Organización de las Naciones Unidas para la Alimentación y la Agricultura (FAO), la prevalencia de personas subalimentadas se redujo de 18.6 a 10.9% entre 1990-92 y 2014-16, lo que representa cerca de 780 millones de personas subalimentadas para 2016.2
Para evaluar el progreso hacia menores niveles de IA, se ha hecho indispensable la creación de herramientas de medición para diversos indicadores asociados con este fenómeno: disponibilidad local insuficiente de calorías, deficiencia de talla, baja ingesta de nutrimentos y pobreza.3 Incorporado a ello, hace ya más de veinte años, se propuso la generación de instrumentos enfocados en la experiencia de los hogares que padecen hambre,4 como las escalas basadas en la experiencia de inseguridad alimentaria que dieron lugar al Módulo de la Encuesta de Seguridad Alimentaria del Hogar en los Estados Unidos. A este instrumento siguieron en su desarrollo la Escala de Acceso de Inseguridad Alimentaria en el Hogar, la Escala Latinoamericana y Caribeña de Seguridad Alimentaria (ELCSA) y, recientemente, la Escala de Experiencia de Inseguridad Alimentaria (FIES, por sus siglas en inglés: Food Insecurity Experience Scale).5 Dada su estructura, la facilidad en su aplicación, análisis y capacidad de medición a nivel del hogar e individual, se considera que estas herramientas contribuyen a mejorar la focalización de los recursos y la efectividad de los programas para la erradicación del hambre. A todas estas herramientas les es común un marco conceptual desarrollado por Radimer y colaboradores, que permite la diferenciación de categorías que reflejan diferentes niveles de severidad en la experiencia de la IA.4
El supuesto de severidad de IA detrás de estas escalas, imposible de ser observado directamente, puede ser inferido mediante la aplicación de modelos de análisis basados en la “teoría de respuesta al ítem (TRI)” (IRT, por sus siglas en inglés: Item Response Theory).6,7 En el año 2010 se realizó el primer análisis comparativo entre países latinoamericanos en torno a las características psicométricas de la ELCSA, el cual encontró diferencias entre los países para algunos de los ítems, por lo que se estableció la necesidad de desarrollar una escala armonizada que permitió una mejor comparación entre países.8
A partir de ese momento se hizo intensiva la investigación sobre el tema y, en el año 2013, la FAO, a través del proyecto Voces del Hambre (VOH, por sus siglas en inglés: Voices of the Hungry), desarrolló la FIES, la cual provee información sobre el acceso a los alimentos a nivel individual y del hogar mediante preguntas directas sobre la experiencia de las personas.9 En el año 2014 esta herramienta fue incorporada en la encuesta Gallup World Poll (GWP), la cual ha sido conducida anualmente en más de 150 países desde 2005.10 La FIES, al igual que otras herramientas similares, permite categorizar a las personas o los hogares en diferentes niveles de severidad de la IA (leve, moderada, severa) dependiendo del número de respuestas afirmativas a los ítems que la conforman.9 En un primer reporte publicado por la FAO usando datos de 2014, la prevalencia de IA severa fue de 8.6, 10.9 y 7.5% para Colombia, Guatemala y México, respectivamente.11 Es importante recordar que la FIES ha sido adoptada por Naciones Unidas como indicador del Objetivo de Desarrollo Sostenible núm. 2 (Hambre cero).12 De ahí deriva la importancia de conocer el funcionamiento de esa escala y su comparabilidad entre países y a lo largo del tiempo. En este sentido, el objetivo de este estudio fue comparar las características psicométricas de la FIES y el grado de similitud o diferencias de las mediciones entre Colombia, Guatemala y México durante los años 2014, 2015 y 2016.
Material y métodos
Diseño y población de estudio
Estudio de comparación psicométrica del módulo de la escala FIES, aplicada en la encuesta GWP en 2014, 2015 y 2016. Las preguntas son a nivel individual y tienen un periodo de referencia correspondiente a los 12 meses previos a la encuesta.9 La GWP es representativa a nivel nacional para residentes mayores de 15 años en cada uno de los países encuestados; el encuestado era seleccionado aleatoriamente entre los miembros mayores de 15 años, siempre y cuando viviera dentro del hogar.13 Para este análisis se seleccionaron tres países de Latinoamérica, por la experiencia de estos países con escalas de inseguridad alimentaria. Se seleccionó Colombia pues fue uno de los primeros países en iniciar esfuerzos de validación de escalas en América Latina en el año 2004;14 México debido a que ha estado aplicando de manera exitosa la ELCSA en encuestas nacionales, y Guatemala porque ha aplicado este tipo de escalas a nivel nacional en encuestas de condiciones de vida, además de su incorporación en los sistemas de evaluación de los programas de lucha contra el hambre.15,16
Variables de interés
La FIES está constituida por una serie de ocho preguntas, cada una con cuatro opciones de respuesta, las cuales fueron codificadas en variables dicotómicas (sí=1; no=0), dejando como datos perdidos “no sabe” y “no responde”, que correspondieron a menos de 5% para cada ítem en todas las bases de datos. Cada pregunta se refiere a una experiencia o comportamiento de las personas en torno a la IA, reflejando una a una un incremento gradual de los niveles de severidad cuando los recursos para la obtención de alimentos son limitados, manifestando igualmente el constructo teórico de IA (cuadro I).9,17,18 Además, se resaltan en negritas y se subrayan las palabras clave para cada ítem que se usaron como etiqueta.
Orden de los ítems |
Pregunta de la escala pensando en los últimos 12 meses |
Dominio del constructo de inseguridad alimentaria |
Severidad de inseguridad alimentaria |
|||
1 |
¿Usted se halla preocupado por no tener suficientes alimentos para comer por falta de dinero u otros recursos? |
Incertidumbre y preocupación acerca de los alimentos |
Leve |
|||
2 |
¿Hubo alguna vez en que usted no haya podido comer alimentos saludables y nutritivos por falta de dinero u otros recursos? |
Inadecuada calidad de los alimentos |
Leve |
|||
3 |
¿Hubo alguna vez en que usted haya comido poca variedad de alimentos por falta de dinero y otros recursos? |
Inadecuada calidad de los alimentos |
Leve |
|||
4 |
¿Hubo alguna vez en que usted haya tenido que dejar de desayunar o almorzar o cenar porque no había suficiente dinero u otros recursos para obtener alimentos? |
Insuficiente cantidad de alimentos |
Moderado |
|||
5 |
¿Hubo alguna vez en que usted no haya comido menos de lo que pensaba que deba comer por falta de dinero u otros recursos? |
Insuficiente cantidad de alimentos |
Moderado |
|||
6 |
¿Hubo alguna vez en que su hogar se haya quedado sin alimentos por falta de dinero u otros recursos? |
Insuficiente cantidad de alimentos |
Moderado |
|||
7 |
¿Hubo alguna vez en que usted haya sentido hambre, pero no comió porque no había suficiente dinero u otros recursos? |
Insuficiente cantidad de alimentos |
Severo (hambre) |
|||
8 |
¿Hubo alguna vez en que usted haya dejado de comer todo el día por falta de dinero u otros recursos? |
Insuficiente cantidad de alimentos |
Severo (hambre) |
FIES: Food Insecurity Experience Scale; GWP: Gallup World Poll
Fuente: adaptado de referencia 17
Análisis de la información
Los datos fueron analizados mediante la aplicación del modelo Rasch de las siguientes maneras: 1) análisis de los datos de cada año por país separadamente para determinar la severidad relativa y el ajuste próximo (INFIT) de cada ítem en cada una de las mediciones; 2) análisis de una base compuesta por los tres años para cada país con el fin de identificar diferencias nacionales entre las mediciones hechas en esas ocasiones, y 3) análisis de tres bases con los datos de los tres países para cada año por separado con el fin de detectar diferencias entre los países año tras año. Adicionalmente, se realizó un análisis con el mayor número de iteraciones posibles y cambios en los procesos de convergencia para mejorar y comparar la estimación de los resultados. También se hizo un análisis removiendo datos considerados extremos (outliers), tomando en cuenta a los sujetos que respondieron de manera afirmativa solamente a los ítems 6, 7 u 8. Todo el análisis fue hecho usando el “Rasch Measurement Software-Winsteps” versión 3.72.2.19
Modelo Rasch
Varios estudios en Latinoamérica han aplicado este modelo para la medición de la IA,6,20,21,22 así como para realizar comparaciones entre países y evaluar el comportamiento de las escalas de IA.8,23 Este análisis se enmarca en la estimación de parámetros de los ítems según su severidad mediante un modelo logístico uniparamétrico conocido como la “Teoría de Respuesta al Ítem”, utilizando la máxima verosimilitud incondicional (UCON, por sus siglas en inglés: Unconditional Maximum Likelihood o también conocido como Joint Maximum Likelihood Estimation [JMLE]). La UCON realiza un ajuste con su sesgo conocido hacia la sobredispersión de los parámetros del ítem, con lo que se obtiene una estimación más exacta,11,24 y es aplicado a través del paquete estadístico utilizado para este estudio (Winsteps).25
Estos parámetros en la medición de IA reflejan la severidad relativa del ítem, construyendo una escala expresada en logit y ordenada de manera creciente, permitiendo establecer si efectivamente la severidad teórica de los ítems concuerda con los valores del modelo.26 Se detalla que, a mayor severidad de IA, mayor es la probabilidad de que la persona responda afirmativamente a todos los ítems. La probabilidad de que una persona afirme un ítem es la función logística entre la diferencia del nivel de severidad de IA del individuo y el nivel de severidad del ítem.
Mediante este modelamiento, se asume que cada ítem de la escala es independiente, debido a las características unidimensionales del modelo Rasch, es decir, están determinadas por una sola dimensión o atributo, en este caso la falta de acceso de alimentos.26,27 Por otro lado, mediante el estadístico de ajuste próximo INFIT, se detectó el desajuste a la respuesta de los ítems de la zona del constructo de IA, y se evaluó el supuesto de que todos los ítems son discriminados por igual. Lo ideal es que todos los parámetros tengan un INFIT igual a 1, pero se han establecido rangos de muy buen ajuste (0.8-1.2) y aceptable (0.7-1.3).28 Valores por encima del rango aceptable significan que el ítem no está cumpliendo con el principio de unidimensionalidad del modelo y valores por debajo indican menor variación del modelo predicho respecto a lo observado.8
Las mediciones anteriormente mencionadas se estimaron en los tres países y en los tres años. Además de estas estimaciones, se generó un parámetro para observar las similitudes y diferencias para cada ítem entre los siguientes grupos: sexo, los tres años en cada país y entre países por cada año, mediante el funcionamiento diferencial de los ítems (DIF, por sus siglas en inglés: Differential Item Functioning). Este análisis se enfoca en la generación de estadísticos de severidad relativa para cada grupo (valores DIF). Existen dos hipótesis para el DIF y dependen principalmente de la cantidad de grupos a comparar. Cuando se comparan dos grupos, la hipótesis del DIF consiste en que cada ítem tiene la misma severidad en ambos grupos; en este caso se genera un parámetro llamado “Contraste DIF” (c-DIF), el cual es la diferencia del valor de severidad del ítem entre los dos grupos. Por otro lado, al comparar más de dos grupos entre sí, la hipótesis del DIF cambia enfocándose en que cada ítem tiene la misma severidad que el promedio de severidad de los grupos y se establece un “tamaño DIF”. Éste representa la diferencia entre el valor de severidad del ítem para cada grupo y el valor de severidad general de todos los grupos (promedio).29
En este estudio se reporta el c-DIF para el análisis de las siguientes variables: 1) sexo de la persona que responde (mujer vs hombre); 2) años en que se aplicaron las FIES en cada país (2014 vs 2015; 2014 vs 2016, y 2015 vs 2016), y 3) países para cada uno de los años (Colombia vs Guatemala; Colombia vs México, y Guatemala vs México). Los valores c-DIF positivos indican que el ítem es más severo para el primer grupo en comparación e implica la posible existencia de una diferencia entre los grupos que puede estar afectando los resultados. De igual manera se realiza el reporte del “tamaño DIF”, para el caso de la agrupación por los tres años y por los tres países. En varios estudios relacionados con la medición de IA se ha establecido un punto de corte de “c-DIF” mayor a 0.5 logit;30,31,32 otros hacen referencia a un punto mayor de 1.0 logit,8,33 e incluso algunos estudios consideran que un puntaje inferior a 2 logit no es considerable para establecer diferencias entre grupos de poblaciones.34,35 Publicaciones reportadas en Archives of the Rasch Measurement - Special Interest Group, establecen que valores de “c-DIF” menores a 0.5 logit no reflejan diferencias entre los grupos; valores entre 0.50 a 1.0 logit presentan una probabilidad mínima de diferencia, pero probablemente no importante, y en valores superiores a 1.0 logit la diferencia entre los grupos es notable.36,37 Debido a que hasta el momento no existe un rango específicamente establecido para el valor c-DIF en la medición de IA, en este estudio se reportaran los valores por encima a 0.5, haciendo mayor énfasis en los valores mayores a 1.0.
Resultados
Para cada país, por año, se incluyeron 1 000 individuos en total. Sin embargo, la distribución por sexo de las personas entrevistadas varió entre países y entre años. La mayoría de las personas entrevistadas fueron mujeres (51.3 a 63.3% de las muestras). La mayor diferencia porcentual entre mujeres y hombres correspondió a Colombia en 2014 y la menor diferencia a México en 2015.
Severidad relativa
En términos generales, los ítems presentaron, con pocas excepciones, una severidad relativa que corresponde con lo esperado desde el punto de vista teórico (IRT).26 Es decir, los ítems correspondientes a la categoría leve (preocupado, alimentos saludables y variedad) mostraron los menores valores de severidad relativa. En el otro extremo, los dos ítems correspondientes a la inseguridad alimentaria severa (hambre y todo el día) presentaron los valores más altos de severidad relativa. En el ordenamiento de los ítems para 2016 (figura 1), la categoría de severidad leve (tres primeros ítems) no presentó cambios en los países; en la categoría moderada y severa, Guatemala fue el único país que el ítem 4 (desayunar) reportó una mayor severidad relativa que el ítem 7 (hambre); este mismo comportamiento se detalló en 2014 y 2015. Para 2014, en Colombia el ítem 7 (hambre) presentó una menor severidad relativa que los ítems 4 (desayunar) y 6 (sin alimento). México fue el único de los tres países que no modificó el ordenamiento de severidad relativa teórica de los ítems.
El ítem 4 (desayunar) en Colombia se ubica en la posición 6 en 2014 y 2016, mientras que en 2015 estuvo en la posición 5; en Guatemala se presenta en la posición 7 en los tres años y, finalmente, en México se localiza en la posición 5 para los tres años. El ítem 7 (hambre) en Colombia se ubica en la posición 5 en 2014 mientras en 2015 y 2016 se mantuvo en la posición 7. En Guatemala se presenta en la posición 5 en 2015, cambiando a la posición 6 en 2015 y 2016, a diferencia de México en donde se localiza en la posición 7 en los tres años.
La mayoría de los ítems en cada año mostraron un ajuste aceptable según los valores INFIT (0.7-1.3). A excepción del ítem 8 (todo el día) en Colombia presenta un INFIT de 1.36 en 2015, mientras en México es de 1.36 y 1.44 en 2014 y 2016, respectivamente. El valor INFIT del ítem 1 (preocupación) en Guatemala es de 1.34 en 2016. El ítem 7 (hambre) para el año 2014 en Guatemala es el único que presenta un INFIT de 0.68.
Similitudes y diferencias
En la figura 2 se detallan los valores de contraste DIF por grupo según sexo; no se evidenció ningún valor de c-DIF por encima de 1.0 logit. En 2014, el ítem 4 (Desayunar) presentó valores de c-DIF de 0.62 y 0.71 logit en Colombia y Guatemala, respectivamente. El ítem 8 (todo el día) arrojo un c-DIF de 0.73 logit en Colombia para 2015. El único ítem que presentó un valor negativo en este rango fue el ítem 2 (alimentos saludables) en Guatemala para 2014 (c-DIF=-0.70 logit).
En el análisis de c-DIF por grupo de años para cada país (figura 3), la mayoría de los ítems estuvieron por debajo de un c-DIF de 0.5 logit. El ítem 8 (todo el día) presentó un c-DIF de 1.38 logit en México en la comparación 2016 vs 2014. Este mismo ítem presentó valores en el rango de 0.5 a 1.0 en la comparación 2016 vs 2015 en los tres países (c-DIF=0.77; 0.6 y 0.68 logit para Colombia, Guatemala y México, respectivamente) y 2015 vs 2014 en México (c-DIF=0.70). En este mismo rango de valor c-DIF se evidenciaron en la comparación 2014 vs 2015, el ítem 6 (sin alimentos) y el ítem 2 (alimentos saludables) en Colombia (c-DIF=0.70 y -0.79 logit, respectivamente), y el ítem 3 (variedad) en México (c-DIF= de 0.78 logit). En la comparación 2014 vs 2016, el ítem 3 (variedad) en México (c-DIF=0.65 logit) y el ítem 2 (alimentos saludables) en Colombia (c-DIF= -0.73 logit) y, finalmente, en 2015 vs 2016 el ítem 1 (preocupación) en Colombia (c-DIF=0,8 logit). En el cálculo del “Tamaño DIF”, el valor más alto se presentó en el ítem 8 (todo el día) en México para 2016 (tamaño DIF=0.78 logit).
Al realizar el análisis de c-DIF entre países por año, 87% de los ítems estuvieron por debajo del valor de 0.5 logit. Del 13% restante, se observan valores c-DIF para el ítem 8 (todo el día) en 2016 (figura 4), de 1.14 y 1.02 logit en Colombia vs México y Guatemala vs México respectivamente. Para el año 2014, este mismo ítem presentó valores mayores a 2.0 logit en Colombia vs México y Guatemala vs México, mientras para 2015 reportó valores de 1.06 y 1.12 logit en Colombia vs México y Guatemala vs México, respectivamente. El ítem 1 (preocupación), al comparar México vs Colombia, presentó valores c-DIF de 0.84; 0.66 y 1.06 logit en 2014, 2015 y 2016, respectivamente. En la comparación entre México vs Guatemala se observaron valores de 0.87, - 0.89 y 0.76 logit en 2014, 2015 y 2016, respectivamente, para este mismo ítem. En el año 2014, el ítem 3 (variedad) presentó un c-DIF de 0.97; 0.85 y 0.84 logit en México vs Colombia, México vs Guatemala y Colombia vs México, respectivamente. Se detalla que el año 2014 presentó valores c-DIF más altos y una mayor cantidad de ítem por encima de 0.5 logit. Los valores de tamaño DIF para México fueron -1.23, -0.79 y -0.79 logit en el 2014, 2015 y 2016, respectivamente. En el año 2014, Colombia y Guatemala presentaron valores de tamaño DIF de 0.73 y 0.72 logit.
Al analizar los resultados, removiendo los datos extremos u outliers, y con el mayor número de iteraciones posibles y cambios en los procesos de convergencia, los resultados no mostraron diferencias relevantes e importantes en las estimaciones de severidad relativa de los ítems ni en los valores INFIT y DIF.
Discusión
La mayoría de los ítems en los tres países tienden a mantener su comportamiento de severidad asumida originalmente en la FIES (cuadro I), con excepción del ítem 4 en Guatemala para los tres años y el ítem 7 en Colombia y Guatemala para el año 2014. México fue el único país en los tres años en el que no se evidenció cambio en el constructo de severidad. Igualmente, los ítems en los tres países presentaron un buen ajuste en el constructo de IA, debido a que la mayoría de los INFIT se encontraron en el rango aceptable, con excepción de los ítems 1 y 8. Lo anterior resalta la relevancia de la FIES como la herramienta internacional para la medición de IA para tomadores de decisiones, académicos e investigadores.
En 2010 se realizó la evaluación psicométrica en los mismos países del presente estudio, pero con la ELSCA, evidenciando que la cuarta parte de los ítems mostraron un c-DIF (mujeres vs hombres) por encima de 1.0 logit, debido posiblemente a que los datos analizados fueron generados a partir de tres versiones de ELCSA con modificaciones en los procesos de adaptación y diferencias en el lenguaje y la redacción, además de que las muestras difirieron en cuanto a su representatividad.8 En el presente estudio, ningún ítem estuvo por encima de este valor, lo que contribuye a una mejoría en las comparaciones de medición de IA entre países.
En un análisis realizado por FAO con los datos de la FIES 2014 para 146 países, 93% de éstos estuvieron en el rango de ajuste aceptable; sólo siete países tuvieron algún ítem por encima de 1.4, por lo que recomiendan realizar investigaciones con la recopilación de datos de varios años, para explorar las posibles causas.38 Al realizar esta exploración con los datos del presente estudio, los valores de INFIT para los ítems 1 y 8 estuvieron entre 1.23 y 1.24, respectivamente; es decir, se encuentran en el límite superior del rango del ajuste aceptable, a excepción del ítem 8 (todo el día) en México en 2016, que continúa con un valor alto (INFIT=1.38). Aun así, se puede considerar que no es un valor que genere cambios en el ajuste del constructo debido a que el software utilizado (Winsteps) realiza la estimaciones de los parámetros mediante JMLE, el cual tiende a incrementar los valores INFIT de los ítems ubicados en los extremos.24,39
Por otro lado, se observa en los presentes resultados valores altos de c-DIF en mujeres vs hombres, en los ítems 8 (todo el día) y 4 (desayunar), en donde el grupo de mujeres podría presentar posiblemente una mayor presencia de severidad en estos ítems. Sin embargo, en algunos estudios estos valores altos de c-DIF no son considerados potenciales generadores de diferencias significativas entre grupos.8,33,34,35 En el año 2013, en resultados similares a partir de los datos de la FIES de Malawi, las diferencias entre hombres y mujeres no se consideraron como un sesgo sustancial en la comparación en la prevalencia de IA.40 Este comportamiento se ha evidenciado con otras escalas: en el estudio realizado en Brasil con ELCSA (2004) se observa que las características psicométricas de la escala no difieren entre hombres y mujeres.30
Esta evaluación del c-DIF en la medición de IA no solamente se realiza en la comparación entre mujeres y hombres. En Colombia se analizó el comportamiento de la ELCSA entre hogares rurales y urbanos, así como entre hogares con diferente número de niños en su interior.32 En zonas rurales de Zambia en 2016, en la validación interna de Food Access Survey Tool (FAST) para la evaluación de la IA, se compararon los grupos de alfabetización, posición jerárquica del responsable del hogar y el idioma.41 Esta misma herramienta fue evaluada en zonas rurales en Bangladesh realizando igualmente comparaciones entre alfabetización y grupos de edad (≤30 años y >30 años).42
Para este estudio se analizó el comportamiento de la FIES entre varios puntos temporales y entre los países mediante el c-DIF, al evidenciar que el ítem 8 (todo el día) posiblemente presentó diferencias en la severidad y entendimiento entre los tres años analizados en México. En la comparación entre países, igualmente en el ítem 8 (todo el día), Colombia y Guatemala presentaron una mayor severidad al ser comparados con México. En relación con el “tamaño DIF”, el ítem 8 (todo el día) en México presenta una mayor severidad para 2016 que la esperada al ser comparado con la severidad promedio de los tres años, por lo que es importante realizar investigaciones para explorar el comportamiento de las escalas de IA en el transcurso del tiempo en el mismo país y entre países.
Una de las limitaciones del presente estudio es su diseño de base, el cual no permite realizar posibles asociaciones de las condiciones de la IA, así como posibles comparaciones del comportamiento de los ítems en otros grupos, como los etarios o de estrato socioeconómico, debido a la disponibilidad de estas variables. Sin embargo, una de sus fortalezas es que ayuda a superar limitaciones metodológicas en la comparación entre países,8 debido a que la versión de la encuesta de la FIES es la misma en los tres países y en los tres años analizados, además de que el tamaño de muestra es representativo para cada país.17,43 Asimismo, su constructo de IA refleja elementos transculturales en común con el constructo evidenciado en el estudio de Coates y colaboradores, en la comparación que realizan a 22 escalas de IA.43
Conclusiones
Los resultados de este estudio resaltan la relevancia de la FIES como la herramienta internacional para la medición de IA, debido a que presenta las características psicométricas correspondientes al constructo teórico de IA. Futuros estudios, con la inclusión de más países y más puntos temporales, son esenciales para evaluar la severidad relativa, comportamiento y distribución de los ítems, así como la comparación entre países con diferentes lenguas, ya que este estudio se basó solamente en tres países de habla hispana.