SciELO - Scientific Electronic Library Online

 
vol.57 número4En el contexto actual de las enfermedades infecciosas emergentes, ¿debería incorporarse la enseñanza de la salud global en programas de medicina de América Latina?La organización de los servicios de salud y su relación con la utilización y acceso a las pruebas rápidas para la detección del VIH en las poblaciones clave en Morelos, México índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay artículos similaresSimilares en SciELO

Compartir


Salud Pública de México

versión impresa ISSN 0036-3634

Salud pública Méx vol.57 no.4 Cuernavaca jul./ago. 2015

 

Artículo original

 

Medición simplificada del nivel socioeconómico en encuestas breves: propuesta a partir de acceso a bienes y servicios

 

Simplified indicator of socioeconomic status in short surveys: a proposal based on assets and services

 

Rodrigo Díaz-Acosta, PhD,(1) Andrey Ryo Shiba-Matsumoto, MD,(1) Juan Pablo Gutiérrez, PhD.(1)

 

(1) Centro de Investigación en Evaluación y Encuestas, Instituto Nacional de Salud Pública. Cuernavaca, México.

 

Autor de correspondencia

 

Resumen

Objetivo. Desarrollar un indicador socioeconómico para encuestas breves que permita una clasificación en relación con un criterio poblacional y que resulte parsimonioso.

Material y métodos. Se generó un indicador socioeconómico a partir de variables dicotómicas de bienes y servicios. Se obtuvo la correlación de los resultados obtenidos de la Encuesta Nacional de Ingresos y Gastos en los Hogares ENIGH con los de una encuesta breve y se les comparó con los de un indicador construido a partir de un conjunto mayor de variables.

Resultados. La concordancia para los quintiles 1, 2, 3, 4 y 5 del indicador amplio y el parsimonioso son 94, 94, 82, 83 y 89%, respectivamente. El coeficiente de correlación por rangos de Spearman fue de 0.85.

Conclusiones. El indicador parsimonioso propuesto captura la heterogeneidad del nivel socioeconómico en la encuesta probada. Se sugiere su uso para encuestas breves debido a sus ventajas: a) se elabora con variables dicotómicas; b) las variables base no implican el cumplimiento de algún supuesto estadístico; c) es fácilmente calculado, y d) se puede utilizar para comparar grupos.

Palabras clave: clase social; indicadores económicos; vivienda; México.

 

Abstract

Objective. To develop a socioeconomic index for brief surveys that allows a classification in relation to a reference population with a parsimonious approach.

Materials and methods. A socioeconomic index was created using assets and use of services indicators to predict income level within a national representative survey of income (ENIGH, National Survey of Households Income and Expenditures) and then tested with data from a survey among key populations (men who have sex with men/transvestite, transgender, transsexual/female sex workers) and compared to an already published indicator.

Results. The concordance for quintiles 1, 2, 3, 4, and 5 between the two indexes were 94, 94, 82, 83, and 89%, respectively. The Spearman's rank correlation coefficient was 0.85.

Conclusions. The proposed parsimonious index captures the socioeconomic level heterogeneity in the MSM/TTT/FSW survey. The use of this index is suggested for short surveys because of the next advantages: a) it uses dichotomic variables; b) the variables used do not imply the fulfillment of any statistical assumption; c) it is easily calculated; d) it can be used for comparing groups.

Key words: social class, economic indexes, housing; Mexico.

 

Uno de los elementos más importantes en los análisis en salud es la estratificación por nivel socioeconómico (NSE). Se ha documentado ampliamente la relevancia de esta dimensión como determinante del acceso a servicios de salud y en los resultados de salud mismos. No obstante, la medición del NSE resulta compleja ya que se trata de un constructo, esto es, una variable que no es observable en sí misma. Sin duda, esto plantea un reto importante para las encuestas de salud, en las cuales es de particular relevancia conocer información tanto del acceso y resultados en salud, como del NSE de los individuos.

Si bien para las encuestas amplias este reto puede ser abordado mediante indicadores relativamente complejos, para las encuestas breves las dificultades resultan aún mayores dado que la extensión de los instrumentos o la disponibilidad del tiempo para aplicarlas hace poco viable la inclusión de un conjunto amplio de variables que permitan estimar el NSE.

Un aspecto adicional es la población de referencia para la medición del NSE. De forma amplia, se han utilizado abordajes que clasifican a los entrevistados en relación con el mismo conjunto de participantes. Para encuestas con representatividad nacional este abordaje podría ser apropiado al asumir que se obtiene una respuesta homogénea de los diferentes estratos socioeconómicos; sin embargo, para otro tipo de muestras dicho abordaje hace inviable la comparación del NSE entre diferentes estudios. Un ejemplo claro es el estudio de las llamadas poblaciones clave: hombres que tienen sexo con hombres (HSH), mujeres transgénero, travesti, transexual (TTT) y mujeres trabajadoras sexuales (MTS).

Un abordaje alternativo consiste en generar una clasificación que considere a la población de un universo mayor como referencia. Este es el caso, por ejemplo, del indicador socioeconómico desarrollado para la Encuesta Nacional de Salud y Nutrición (Ensanut) 2012, para el cual se tomó como referencia la distribución del ingreso en el país, a partir de información de la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) 2012. Considerando estos aspectos, aunados a las restricciones en información disponible y al interés de un referente general, parece más deseable partir de variables simples y de uso común.1

Cuando se analizan las respuestas de las preguntas dicotómicas (sí o no) de un cuestionario, con frecuencia se tiene la necesidad de agruparlas según ciertos criterios y, con esta agrupación, construir una nueva variable que sea un resumen de la información disponible en las respuestas originales.2 Como estas variables no cumplen con supuestos acerca de la escala de medición y de la distribución de frecuencias, no es posible utilizar técnicas multivariadas.3,4 Cuando las variables son nominales, una alternativa es construir la nueva variable como una combinación lineal de las respuestas de las variables originales.5

El propósito de este trabajo fue desarrollar un indicador socioeconómico basado en pocos supuestos y que incluya un número mínimo de parámetros como sea posible, a fin de proporcionar una adecuada representación, es decir, un indicador que sea parsimonioso y que considere un referente externo.6 Para desarrollar el indicador se utilizó información sobre acceso a bienes y servicios. Éste fue probado en una encuesta sobre factores de riesgo realizada en población clave.

 

Material y métodos

Para elaborar el índice propuesto de bienes y servicios se empleó información de los datos de la ENIGH 2012, encuesta probabilística con diseño por conglomerados y estratificado, representativa de la población del país.7*, La ENIGH se ha utilizado como referente para estimar el nivel socioeconómico de los hogares en México. La información obtenida de la ENIGH para la creación del índice propuesto fueron las variables referentes a la tenencia de bienes (casa, auto, computadora, DVD y microondas) y a la utilización de servicios (internet, cable y teléfono). Estas variables fueron seleccionadas porque también se cuenta con información de ellas en la encuesta sobre factores de riesgo en población clave (HSH/TTT/MTS), en la cual se probaría el índice propuesto. La encuesta en mención fue realizada en 2012 y aprobada por el Comité de Ética y de Investigación del Instituto Nacional de Salud Pública (INSP), de México.

Una vez identificadas las variables para la creación del índice, se obtuvo dicha información de la ENIGH 2012. Se respetaron las variables referentes a tenencia de servicios de teléfono, cable e internet por ser dicotómicas (sí, no). Por otra parte, dado que las variables auto, computadora, microondas y DVD de la ENIGH 2012 son reportadas de acuerdo con el número de aparatos que se poseen en los hogares, se les transformó en dicotómicas. Para esto, se consideraron como "no" las respuestas en las que los encuestados indicaron que no tenían ninguno de los aparatos mencionados (valor 0); a su vez, todas aquellas respuestas en las que los encuestados indicaron tener uno o más fueron consideradas como "sí" (valor 1). En el caso de casa propia, la ENIGH 2012 recoge información sobre el tipo de tenencia de la vivienda (propia, rentada, prestada, etcétera), por lo que para este estudio se consideraron como "sí" únicamente las respuestas en las que se indicó que la vivienda era propia y como "no", todas aquellas distintas a ésta.

Para la comparación y validación se cotejaron los índices de la ENIGH 2012 (nivel nacional) con los otros índices que se detallan a continuación. Se trabajó con tres tipos de índices, los cuales son manejados en quintiles: a) índice socioeconómico de la ENIGH 2012 (y empleado en la Ensanut 2012); b) índice propuesto en este artículo, y c) índice alternativo simple.

Índice socioeconómico ENIGH 2012 (y empleado en la Ensanut 2012)

Se toma la variable de quintiles de ingreso de la base de la ENIGH 2012 como referente de comparación para cuando se trabaja con los datos de la ENIGH 2012. Para cuando se trabaja con los datos de la encuesta de factores de riesgo en población clave, el índice empleado fue el indicador que se basa en la misma metodología que la empleada en la Ensanut 2012,1 la cual consiste en realizar una imputación del nivel de ingreso (en deciles y quintiles) de los hogares incluidos, a partir de indicadores demográficos y socioeconómicos de los hogares. Este abordaje se implementó con los datos de la encuesta de factores de riesgo en población clave. Dicha encuesta se realizó en tres entidades federativas de México: Jalisco, Estado de México y Veracruz. En la encuesta se entrevistó a tres grupos de población: HSH, TTT y MTS. El tamaño de la muestra fue de 2 566 entrevistas. De este total, 1 112 fueron HSH, 420 TTT y 1 034 MTS. En el presente artículo, estos índices de referencia serán descritos como índice socioeconómico (ISE).

Índice propuesto para este estudio

El índice de bienes y servicios que aquí se propone se define operativamente como la sumatoria de los productos de las respuestas de las variables originales (0=no, 1=sí) por sus respectivos coeficientes de ponderación; es decir, es la sumatoria ponderada de las respuestas de las variables nominales que intervienen en el índice.

Para calcular los coeficientes de ponderación, se plantea la optimización de una función lineal llamada función objetivo. Ésta se define como la sumatoria de los productos de las varianzas de las variables que intervienen en el índice propuesto por los coeficientes de ponderación. La función objetivo se optimizó linealmente de acuerdo con las restricciones de no negatividad y con que la sumatoria de los coeficientes de ponderación sea igual a uno.8

donde:

Como el índice propuesto se expresa en escala percentilar, su valor obtenido como una combinación lineal de las variables originales deberá estar entre uno y cien.

Para las ocho variables dicotómicas de bienes y servicios se calcularon probabilidades y desviaciones estándar con base en la información obtenida de la ENIGH 2012. Éstas se ordenaron en sentido decreciente según su variabilidad para estimar así sus coeficientes de ponderación.9 Para cada sujeto se calculó el índice propuesto que lo ubicó en una escala percentilar según la posesión de bienes y el uso de servicios. Así, por orden decreciente de probabilidades, las variables se organizaron de la siguiente manera: dvd (ponderador: 0.25), microondas (ponderador: 0.22), teléfono (ponderador: 0.17), casa propia (ponderador: 0.13), cable (ponderador: 0.10), computadora (ponderador: 0.07), automóvil (ponderador: 0.03) e internet (ponderador: 0.01).

Índice alternativo simple

Para calcular el índice alternativo simple de las ocho variables de bienes y servicios, se realizó una sumatoria de las respuestas absolutas codificadas (cero o uno) de las preguntas dicotómicas; en este caso, el intervalo de esta variable discreta (valores enteros) está entre cero y ocho. Para transformar los valores de la suma de respuestas en quintiles se calcularon los cuatro puntos de corte mediante la interpolación lineal, se determinaron las fronteras de los cinco intervalos y a la suma se le asignó el número ordinal del intervalo que la contiene. La estrategia fue obtener este índice simple para contrastarlo con el ISE (variable de nivel socioeconómico de la ENIGH en quintiles) y poder determinar sus características estadísticas.10

A partir de los datos de la ENIGH 2012, se calcularon el índice alternativo simple y el índice propuesto. Estos índices se compararon por pares con el ISE: el ISE contra el índice alternativo simple (cuadro I) y el ISE contra el índice propuesto (cuadro II). El cálculo de la asociación entre dos variables categóricas se hace mediante la creación de tablas de contingencia.11 Para este estudio, estas tablas de contingencia muestran la asociación del ISE (localizado en las hileras) con el índice alternativo simple y con el índice propuesto (ambos ubicados en las columnas de los cuadros I y II). El cuadro I muestra las probabilidades conjuntas de los quintiles del ISE y los quintiles del índice alternativo simple. El cuadro II presenta los resultados tras haber comparado el ISE con el índice propuesto, y describe la estructura de los quintiles del ISE. Los elementos de las hileras son los porcentajes de los quintiles del índice propuesto en un determinado quintil del ISE. Además, se calculó el coeficiente de correlación por rangos de Spearman para medir la asociación entre ambos índices.

Una vez que se analizó la asociación entre el ISE y el índice propuesto (utilizando los datos de la ENIGH 2012), se procedió a calcular el índice propuesto pero ahora utilizando la información de la encuesta sobre factores de riesgo en población clave, además del ISE con la metodología empleada en Ensanut 2012. La comparación de los dos índices, considerando el total de la encuesta, se presenta en el cuadro III. Los resultados de comparación de los índices cuando se clasifica por grupos clave (cuadro III desagregado) se muestran en el cuadro IV.

 

Resultados

La distribución del índice alternativo simple (empleando datos de la ENIGH 2012) tiene una significativa asimetría negativa, es decir, las mayores frecuencias se presentan en aquéllas cuyas sumas de valores absolutos son 1, 2 y 3, que corresponden a los quintiles 2, 3 y 4 (cuadro I). Se observa que en el quintil 1 (cuando la suma de valores absolutos es 0) o en el quintil 5 (cuando la suma de los valores absolutos es mayor a 5) las frecuencias son menores. En el cuadro I también se puede observar la distribución quintilar del ISE ("Total ISE").

En el cuadro II se aprecia la estructura de cada quintil del ISE conforme al índice propuesto utilizando datos de la ENIGH 2012 para ambos. Se observa la distribución que el índice propuesto tiene en cada quintil del ISE.

En el cuadro V se presentan los coeficientes de concordancia entre el índice propuesto y el ISE. Estos coeficientes son las probabilidades de que un determinado quintil del índice propuesto sea el mismo quintil en el ISE. Los coeficientes de concordancia entre los índices de los datos de la ENIGH 2012 se calcularon multiplicando la matriz de probabilidades del cuadro II por un vector de coeficientes de ponderación (cuadro V, hilera "datos ENIGH"). De acuerdo con lo anterior, 79% de los sujetos fueron clasificados en el primer quintil tanto por el índice propuesto como por el ISE. A su vez, el porcentaje de agrupados en el segundo quintil por el índice propuesto y también por el ISE es 82%. Los porcentajes correspondientes a los quintiles 3, 4 y 5 son 66, 64 y 65%, respectivamente. Una medida global de la asociación de estos dos índices es el coeficiente de correlación de rangos de Spearman, cuyo valor es 0.85.

En la hilera "Total de la encuesta" del cuadro V se observan los coeficientes de concordancia entre las distribuciones quintilares de ISE y del índice propuesto, utilizando ahora los datos de la encuesta sobre factores de riesgo en población clave. Si se consideran las tres entidades en conjunto sin separarlas en sus respectivos grupos (HSH, TTT y MTS), sus valores se incrementan a 94, 94, 82, 83 y 89%, en los quintiles 1 a 5, respectivamente.

Esta tendencia de concordancia entre los quintiles de los dos índices se incrementa cuando los datos de la encuesta se desagregan por grupos clave. En el grupo HSH, los porcentajes son: 99, 82, 84, 84 y 91%; en el grupo TTT, los porcentajes son: 93, 99, 78, 83 y 84%, y en el grupo MTS, los porcentajes son: 94, 96, 83, 81 y 81% (cuadro V).

En la última hilera del cuadro II que presenta las frecuencias de la distribución del índice propuesto usando los datos de la ENIGH con respecto al ISE, se observa que los quintiles 1 y 2 presentan un exceso de 7 y 3%, respectivamente, en tanto que los quintiles 3, 4 y 5 tienen un déficit de alrededor de 3%. A su vez, las frecuencias de la distribución de este índice propuesto en la encuesta sobre factores de riesgo en población clave (cuadro III) oscilan alrededor de 20%, con excepción del quintil 1, que presenta un decremento de 7%, y del quintil 5, que presenta un incremento de casi 5%.

En el cuadro IV los menores porcentajes de los quintiles 1, 2 y 3 se presentan en el grupo HSH (5.19, 8.89 y 14.68%, respectivamente) y los mayores porcentajes en el grupo MTS (21.9, 30.12 y 22.9%, respectivamente). Esta relación se invierte en los quintiles 4 y 5, en donde los mayores porcentajes están en el grupo HSH (28.13 y 43.1%, respectivamente) y los menores porcentajes en el grupo MTS (15.29 y 9.79%, respectivamente). Los porcentajes de los quintiles del grupo TTT se localizan entre los grupos anteriores.

 

Discusión

El indicador parsimonioso propuesto requiere únicamente información de variables dicotómicas y clasifica razonablemente a la población en la encuesta utilizada, por lo que se podría ubicar como una alternativa en aquellas encuestas con restricciones severas en tiempo de aplicación.

En las encuestas, por las ventajas que ofrecen se incluyen peguntas cuyas respuestas son dicotómicas y mutuamente excluyentes ("sí", "no"). Estas variables, que pertenecen a la escala nominal de medición, estadísticamente no plantean el cumplimiento de supuestos teóricos y, por ello, se utilizan métodos no paramétricos para su análisis. Si estas variables nominales se pueden agrupar según algún criterio, entonces es posible resumirlas en un índice que describa al criterio de clasificación. En este trabajo se utilizaron ocho variables dicotómicas para construir un índice que se denominó "bienes y servicios". El cálculo de este índice es una combinación lineal, esto es, la suma de los productos de las variables dicotómicas por sus coeficientes de ponderación. El índice se expresa en percentiles por lo que puede transformarse fácilmente en cuartiles, quintiles, deciles, etcétera.

El coeficiente de correlación de rangos de Spearman entre el índice propuesto y el ISE es de 0.85. Los porcentajes de concordancia entre las distribuciones quintilares de los índices oscilaron entre 82 y 94%. La relación existente entre los índices permite estimar las frecuencias de la distribución quintilar del ISE, utilizando las frecuencias de la distribución quintilar del índice propuesto.

El índice alternativo simple basado en la suma de los valores de las respuestas de las variables dicotómicas, aunque su cálculo es sencillo, presenta dos complicaciones: a) su transformación quintilar requiere de un algoritmo implementado en la computadora porque utiliza el procedimiento de la interpolación lineal para establecer los intervalos y determinar el intervalo que contiene la suma de las variables dicotómicas, y b) su distribución tiene una marcada asimetría negativa, lo cual implica una subestimación del quintil 1 y una sobreestimación del quintil 5. Ambos sesgos son significativos.

Cabe señalar que la información obtenida de la ENIGH hace referencia a la posesión de bienes y servicios a nivel hogar, en contraste con la encuesta realizada a población clave, donde la información refleja la posesión de bienes y servicios a nivel individual. Por lo anterior, podría existir una sobreestimación de posesión de bienes en la información obtenida de la ENIGH 2012. No obstante, no se esperaría que esta diferencia tuviera un impacto importante en el indicador.

Si bien es importante contar con información adicional que permita refinar el abordaje propuesto, la alternativa parsimoniosa que se presenta para la estimación del NSE en encuestas breves puede permitir mejorar las estimaciones de este indicador relevante para contextualizar y comprender mejor los resultados de este tipo de encuestas. En particular, el método resulta útil para el estudio de poblaciones de difícil seguimiento y abordaje, en la cuales es importante contar con instrumentos concretos y breves.

En resumen, las ventajas que presenta el uso de este índice son: a) se elabora con variables dicotómicas; b) las variables base no implican el cumplimiento de algún supuesto estadístico; c) es fácilmente calculado, y d) se puede utilizar para comparar grupos.

Como desventaja, el sesgo más grave podría presentarse cuando el tamaño de la muestra sea pequeño, ya que el error de estimación se incrementaría notablemente. En el caso del presente estudio, el error fue mínimo debido a que el tamaño de las muestras en las que se aplicó el índice propuesto fue considerable.

 

Referencias

1. Gutiérrez J. Clasificación socioeconómica de los hogares en la Ensanut 2012. Salud Publica Mex 2013;55(2):S341-S346.         [ Links ]

2. Sirin SR. Socioeconomic status and academic achievement: a meta-analytic review of research 1990-2000. Rev Educ Res 2005;75(3):417-453.         [ Links ]

3. Harman HH. Modern factor analysis. 2nd ed. Chicago: The University of Chicago Press, 1968:113-334.         [ Links ]

4. Jollife IT. Principal components analysis. In: Springer series in statistics. 1st ed. New York: Springer-Verlag, 1986.         [ Links ]

5. Bishop YMM, Fienberg SE, Holland PW. Discrete multivariate analysis: theory and practice. 1st ed. Cambridge: MIT Press, 1975.         [ Links ]

6. Hand DJ. Statistics and the theory of measurement. Journal of the Royal Statistic Society 1996;(Series A 159):445-492.         [ Links ]

7. INEGI. Encuesta Nacional de Ingresos y Gastos de los Hogares 2012. Diseño muestral MCS 2012: formación de las unidades primarias de muestreo para el levantamiento del MCS-2012. México: INEGI, 2013.         [ Links ]

8. Press WH, Flanney BP, Teukolsky SA, Vetterling WT. Numerical Recipes. 1st ed. New York: Cambridge University Press, 1986:274-334.         [ Links ]

9. May HA. Multilevel Bayesian Item Response Theory method for scaling socioeconomic status in international studies of education. J Educ Behav Stat 2006;31(1):63-79.         [ Links ]

10. Sireci SG, Wainer H, Braun H. Psychometrics, overview. New York: John Wiley & Sons Ltd, 1998.         [ Links ]

11. Agresti A. Categorical data analysis. 2nd ed. New Jersey: John Wiley & Sons Inc, 2002.         [ Links ]

 

Fecha de recibido: 9 de diciembre de 2014
Fecha de aceptado: 14 de abril de 2015

 

Autor de correspondencia:
Dr. Juan Pablo Gutiérrez.
Centro de Investigación en Evaluación y Encuestas,
Instituto Nacional de Salud Pública.
Av. Universidad 655, col. Santa María Ahuacatitlán. 62100
Cuernavaca, Morelos, México.
Correo electrónico: jpgutier@insp.mx

 

Declaración de conflicto de intereses. Los autores declararon no tener conflicto de intereses.

 

Nota

* Para mayor información, referirse al documento metodológico en línea: http://www3.inegi.org.mx/sistemas/Microdatos/Microdatos_archivos/enigh/Doc/Diseno_muestral_MCS12.pdf.