Clasificación JEL: D31, I31, O15.
Introducción
La medición del bienestar es un instrumento indispensable para la planeación de las políticas públicas y para la evaluación del desempeño de un país. Si no se conoce la evolución del bienestar difícilmente se podrán tomar las decisiones adecuadas para incrementarlo. Por lo general, la medición del bienestar pasa por varias etapas. A lo largo del tiempo los indicadores van evolucionando de un nivel muy rudimentario y general, hacia estadísticas sistematizadas que reflejan cada vez con mayor precisión distintas facetas de la calidad de vida de la población, con un creciente detalle por espacios geográficos específicos más allá de los promedios nacionales —como son los estados y municipios o incluso las localidades.
En México, aunque la producción de indicadores de bienestar se ha acelerado en los pasados 15 años, su evolución ha sido históricamente lenta. Por ejemplo, el producto interno bruto (PIB), que es el indicador comúnmente utilizado en el mundo para obtener información de la capacidad de una economía para generar satisfactores para su población, se ha publicado por varios decenios. Sin embargo, dicha publicación no se regularizó, sistematizó y contó con solidez metodológica alineada a criterios internacionales sino hasta 1981. En 1993 comenzó la publicación anual del PIB estatal, y no se cuenta aún con una medición del PIB municipal.
Debido a que el PIB presenta varias limitaciones como indicador de bienestar, recientemente se han desarrollado opciones en las que se incluye información adicional de múltiples facetas del desarrollo. Las tres opciones que han sido adoptadas o utilizadas institucionalmente para la toma de decisiones por lo común son: el índice de marginación (IM) desarrollado por el Consejo Nacional de Población en 1993, el índice de bienestar (IB) propuesto por el Instituto Nacional de Estadística, Geografía e Informática (INEGI) en 1994 y el índice de masas carenciales (IMC) plasmado en la Ley de Coordinación Fiscal en 1997. Estas mediciones comparten tres ventajas: i) resumen en un sólo indicador varias dimensiones del bienestar; ii) utilizan el Censo Nacional de Población y Vivienda o el Conteo Nacional de Población como fuente de información primaria —lo cual implica una cobertura poblacional total—, y iii) pueden ser desagregados por estado y municipio.
De estas opciones, el indicador más utilizado ha sido el índice de marginación. Este índice considera cuatro dimensiones mediante la identificación de nueve factores de exclusión o carencia de oportunidades, incluyendo variables educativas, características de la vivienda e ingresos. Por su par te, el índice de bienestar parte de la idea de que el bienestar proviene de la educación, la vivienda, las características demográficas de los hogares, los ingresos, las condiciones de empleo, y la disponibilidad de bienes y servicios del hogar. Por su parte, el índice de masa carencial se obtiene identificando el número de hogares en cada unidad geográfica que no satisface sus necesidades básicas en cinco rubros (ingreso, educación, espacio habitacional, drena je y tipo de combustible utilizado); se calculan brechas por hogar para cada rubro, que mi den la distancia entre la situación observa da y una norma predeterminada, y los resultados se establecen dentro de una sola escala para poder agregar las cinco brechas de todos los hogares.1
La principal debilidad en el cálculo de estos tres índices es que la información de los ingresos que utilizan proviene de censos y conteos de población. Es muy conocido que los instrumentos de captación de ingresos en los censos están expuestos a una subdeclaración considerable, ya que no están elaborados para captar los ingresos con precisión, lo cual resulta en una subestimación del bienestar. Si bien la utilización de censos y conteos dan la ventaja de la desagregación a niveles estatal, municipal e incluso de localidad, y permiten una medición precisa de variables como las condiciones de la vivienda (que pueden ser incluso corroboradas por el encuestador que aplica el cuestionario en cada hogar), los cuestionarios que se aplican para captar los ingresos permiten obtener de mejor manera los ingresos monetarios en comparación con los ingresos no monetarios (autoconsumo, pago en especie, entre otros). Sin embargo, la variable de ingreso laboral es generalmente la variable con menor precisión entre todas las variables consideradas en el censo.
Otros avances recientes en términos de información del bienestar en México han sido la medición de la pobreza y la medición del desarrollo humano. La medición de la pobreza se comenzó a realizar de manera oficial en 2002, utilizando la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH), publicada por el INEGI, la cual es representativa nacional y para áreas urbanas y rurales. La ventaja de las ENIGH es que están crea das para obtener la medida más precisa posible de los ingresos y gastos tota les de los hogares, así como de las condiciones de la vivienda, y otras variables socioeconómicas. Su principal limitación es que es una muestra que no permite una desagregación de información estatal o municipal con un grado de precisión estadísticamente confiable. En realidad, por ser una muestra aleatoria de la población, esta encuesta no incluye información de todos los municipios del país.
Por su parte, en 2003 el Programa de Naciones Unidas para el Desarrollo (PNUD) publicó por primera vez un Informe de Desarrollo Humano para México, en el que se estimó el índice de desarrollo humano (IDH) —compuesto por variables de educación, salud, así como el producto interno bruto proveniente de las cuentas nacionales. Al utilizar al PIB per capita como uno de sus indicadores de bienestar, el IDH puede ser desagregado a nivel nacional y estatal, pero no municipal. Es importante también notar que a diferencia del IM, el IB y el IMC, que utilizan los ingresos captados en los censos, el IDH utiliza al PIB como indicador de los ingresos de la población, precisamente por que considera que esta variable es más representativa de los recursos disponibles, que los ingresos censales.
En resumen, las estadísticas para medir la evolución de las condiciones de vida de la población y para realizar una mejor planeación del desarrollo en México, se encuentran entre dos extremos: precisión o detalle. Por un lado, a lo largo de los años se han desarrollado tres indicadores de bienestar que permiten una desagregación geográfica estatal, municipal, e incluso lo cal en algunos casos, pero con la limitación de incluir información de los ingresos poblacionales que se caracterizan por estar altamente sub estimados. Por otro lado, recientemente se ha establecido una metodología para la me dición oficial de la pobreza que incluye una estimación más precisa de los ingresos de los hogares, así como también se han estimado los IDH del PNUD utilizando variables más sólidas de ingresos que los primeros tres indicadores.2 Sin embargo, tan to las medidas de pobreza como los IDH cuentan con la limitación de no ser desagregables más allá del nivel nacional o de regiones rurales o urbanas (en el caso del primero), o más allá del nivel estatal, en el caso del segundo. Este conflicto entre precisión y detalle tiene como consecuencia que la evaluación de las condiciones de vida de la población del país y la planeación lo cal se encuentren restringidas.
La principal causa del conflicto entre precisión y detalle es sencillamente la restricción presupuestaria que se enfrenta en la generación de estadísticas. La recabación de información pormenorizada de los ingresos o gastos de los hogares requiere cuestionarios amplios y entrevistas que consumen tiempo, y que necesitan de personal especializado y de visitas continuas al hogar, lo cual aumenta considerablemente el costo por cuestionario. Por es te motivo es tos instrumentos se aplican por lo general a muestras restringidas de la población, lo que reduce sus posibilidades de agregación. Cuando se incluyen preguntas respecto a los ingresos en los censos de población, los cuestionarios tienen que restringirse a pocas preguntas generales y a menores de mandas de tiempo y capacitación por parte de los encuestadores, que si bien permiten el registro del rubro de ingreso para toda la población, lo hacen de manera mucho más limitada. Aplicar cuestionarios de ingresos como los utilizados en las encuestas de ingreso-gasto de los hogares a la población que se considera en un censo es inviable financieramente.
Es importante subrayar que el conflicto entre precisión y detalle no es exclusivo de México. Este fenómeno es común en la América Latina y, en general, en los países en desarrollo. En respuesta a ello, recientemente Elbers, Lanjouw y Lanjouw (2003) propusieron una metodología que consiste en elaborar modelos que especifican al ingreso como función de las características del hogar, de la vivienda, de los miembros del hogar, de la lo calidad y de otros indicadores, para luego imputar (con base en la predicción estadística) un ingreso con menor grado de error a cada hogar en el censo poblacional.
Este artículo presenta la primera aplicación y adaptación de esta metodología al caso de México. La estimación permite obtener un mapa de los ingresos de la población nacional, estatal, municipal e incluso local, con precisión y con detalle. El procedimiento permite, por un lado, reducir el error de medición de indicadores como el IM, el IB y el IMC, y por otro, desagregar el IDH y los indicadores de pobreza a nivel estatal, municipal e incluso lo cal. La información que utilizamos es para 2000, ya que para dicho año se cuenta tanto con un Censo Nacional de Población y Vivienda, como con una ENIGH. La coincidencia en temporalidad hace que estos dos instrumentos sean ideales para la aplicación de la metodología de imputación.
El artículo está organizado de la manera siguiente. La sección I analiza de manera más amplia los problemas de información a los que nos hemos referido e ilustra gráficamente las limitaciones de las estadísticas de ingreso con que se cuenta en la actualidad. La sección II presenta una breve revisión de la bibliografía teórica referida a la imputación de ingresos de fuentes de datos distintas. La sección III describe la metodología empleada para el caso de México. La sección IV presenta nuestras estimaciones de ingreso estatal y municipal. La sección V utiliza las estimaciones de ingreso para calcular el IDH municipal. Por último se presenta algunas conclusiones.
I. El problema: mucha información, pero poca precisión pormenorizada
En esta sección ilustramos gráficamente el conflicto entre precisión y detalle que existe al utilizar las bases de datos existentes en México para la medición del bienestar. Centramos el análisis en las tres fuentes de información de ingresos más utiliza das en la bibliografía y en la elaboración de las políticas públicas: la ENIGH, el Censo Nacional de Población y Vivienda, y la Encuesta Nacional de Empleo (ENE). En todos los casos, nos referiremos a 2000, que es el mismo año que utilizamos en la presentación de nuestros resultados en la sección IV.
La ENIGH tiene como principal objetivo medir los ingresos y los gastos de los hogares.3 Su elaboración responde a obtener la mayor precisión posible de los recursos monetarios con los que cuenta la población. Su marco muestral se construyó a partir de la información demográfica y cartográfica del Conteo Nacional de Población de 1995. La elaboración muestral es probabilística, estratificada, polietápica y por conglomerados. La estratificación de las unidades primarias de muestreo (UPM) se realiza con base en las siguientes variables socioeconómicas: porcentaje de la población de 6 a 14 años de edad que sabe leer y escribir, el Porcentaje de la población de 15 años y más que es alfabeta, el porcentaje de viviendas con drenaje conectadas a la red pública, el porcentaje de viviendas con agua entubada dentro de la vivienda y el porcentaje de viviendas con electricidad. El tamaño de la muestra es de 10 108 hogares, con representatividad nacional, y por zonas urbanas y rurales.
El cuestionario de la ENIGH capta seis grandes rubros de ingreso: remuneraciones al trabajo, ingresos por negocios propios, ingresos por cooperativas, ingresos por renta de la propiedad, transferencias e ingresos no monetarios. Ca da uno de estos grandes rubros se desglosa para obtener un mayor detalle, de manera que el cuestionario identifica y registra en total 48 fuentes de ingreso monetario y 243 fuentes de ingresos no monetarios. Este desglose responde al objetivo de obtener una mayor precisión en la captación de información.
La gráfica 1 presenta el ingreso per capita de la población de acuerdo con la ENIGH 2000. Según nuestras estimaciones, el ingreso mensual por persona en ese año es de 1 871 pesos. Sin embargo, debido a que la estimación es a partir de una muestra de la población, está sujeta inevitablemente a un error muestral. La gráfica muestra que dicho error es alrededor de 3%, lo cual es bastante reducido y da una buena idea del alto grado de precisión de la encuesta.
![](/img/revistas/ete/v75n300//2448-718X-ete-75-300-843-gch1.jpg)
Gráfica 1 Discrepancia en el valor del ingreso per capita nacional al comparar distintas fuentes de información (representativa)
La segunda fuente de información que consideramos es el Censo Nacional de Población y Vivienda. El objetivo del censo es cuantificar a la población y a los hogares de México, y obtener un per fil socioeconómico básico que permita la caracterización de la dinámica demográfica. En su cuestionario, el censo incluye solamente seis preguntas respecto a los ingresos monetarios con los que cuentan los hogares —a diferencia de los 48 rubros que registra la ENIGH. Más aún, las seis preguntas solamente cubren tres de los grandes rubros incluidos en la ENIGH, y en los tres casos, el desglose y por tanto la precisión de los registros es mucho menor. Específicamente, el censo registra el ingreso por trabajo, por jubilaciones, por ayudas familiares dentro y fuera del país, por transferencias de los programas Procampo y Progresa, y becas, así como otros ingresos.
La consecuencia obvia de estaba te ría limitada de registros es que el ingreso que capta el censo es mucho menor al que capta la ENIGH —se excluyen fuentes de ingreso importantes, como por ejemplo, los ingresos por renta de la propiedad y los ingresos por negocios propios, así como también los ingresos no monetarios en su totalidad. Dadas las diferencias en los cuestionarios, la discrepancia puede atribuirse sin duda al instrumento de captación.
La gráfica 1 muestra que de acuerdo con los registros censales el ingreso mensual por persona en 2000 era de 1 265 pesos, es decir, un ingreso menor en 48.4% al registrado en la ENIGH. Llamaremos a esta diferencia “error de subdeclaración” para fines de nuestro análisis. La diferencia con respecto al error muestral, es que éste se debe a discrepancias en el cuestionario, más que a errores de estimación estadística.
La tercera fuente de información de referencia es la ENE. Esta encuesta consta de un panel rotatorio que se levanta cada tres meses (con reposición de 20% de la muestra en cada levantamiento, y con permanencia de cinco periodos por hogar). El objetivo de esta encuesta es obtener la información más precisa posible de la dinámica del mercado laboral. El cuestionario de la ENE también registra los ingresos de la población, pero al igual que el censo la captación de distintas fuentes es muy limitada. La captación de ingresos en la ENE sólo se centra en ingresos laborales. En suma, esta encuesta presentados limitaciones importantes para su utilización como indicador de ingreso de los hogares: i) que comparte con la ENIGH es que al ser una muestra de la población inevitablemente está sujeta a un error muestral —el levantamiento del tercer trimestre de 2000 fue de 146 274 hogares, lo cual es más de 10 veces mayor al de la ENIGH—, y ii) que es la más importante, es que al igual que el censo la captación del ingreso es altamente restringida, lo que implica que la estimación del ingreso está sujeta a un error de subdeclaración importante.
La gráfica 1 da una idea de las magnitudes de estos dos tipos de error. En el caso de la ENE, considerando la tercera ron da anual de la encuesta, que es la más compatible con el levantamiento de la ENIGH, se observa que el error muestral es de 0.9%. En contras te con el error muestral de la ENIGH correspondiente a 3%, la ENE presenta menor error. Sin embargo, el error de declaración de la ENE corresponde a 37% con respecto a los ingresos registra dos por la ENIGH.
Es evidente que el mejor estimador del ingreso de los hogares nacionales es la ENIGH, ya que tan to el censo como la ENE están sujetos a una gran subdeclaración. Por tanto, en este caso no existe el dilema entre precisión y detalle. Sin embargo, el dilema empieza a cobrar relevancia a medida que se requiere una mayor desagregación. Esto puede ilustrar se al compararlos ingresos que se obtienen de las mismas tres fuentes de información estatal. La gráfica 2 presenta el ingreso per capita mensual para la población del estado de Veracruz. La ENIGH 2000 presenta la particularidad de ser representativa para este estado específico, ya que el gobierno local financió una sobremuestra que permitió alcanzar un tamaño adecuado para este propósito.
![](/img/revistas/ete/v75n300//2448-718X-ete-75-300-843-gch2.jpg)
Gráfica 2 Discrepancia en el valor del ingreso del estado de Veracruz al comparar distintas fuentes de información (representativa)
Por esto, no sorprende que el panorama es similar al de la gráfica 1: la ENIGH presenta un error muestral que es de mucho menor magnitud a los errores de subdeclaración de las otras dos fuentes de información y, por tanto, es la base de datos más adecuada para obtener una idea precisa de los recursos con los que cuentan los hogares en esta entidad federativa.
Por otra parte, la gráfica 3 presenta los resultados para el estado de Aguascalientes. En este caso la ENIGH no cuenta con representatividad estatal, lo cual incrementa considerablemente su error muestral. Por otro lado, el censo y la ENE presentan los errores de subdeclaración inherentes a su elaboración, pero la diferencia entre los dos tipos de error es mucho menor a la que se observó en las gráficas 1 y 2.
![](/img/revistas/ete/v75n300//2448-718X-ete-75-300-843-gch3.jpg)
Gráfica 3 Discrepancia en el valor del ingreso del estado de Aguascalientes al comparar distintas fuentes de información(representativa y no representativa)
Finalmente, la gráfica 4 presenta los resultados para un municipio específico del país: Jesús María, en el estado de Aguascalientes. Es aquí en donde el dilema se hace más evidente. Por un lado, la ENIGH estima un ingreso per capita mensual de 1 532 pesos, con un error muestral de 34%. Por otro lado, del censo se infiere un ingreso de 944 pesos, con un error de subdeclaración de 38%, mientras que en la ENE el ingreso es de 986 pesos, con un error de subdeclaración de 36% y un error muestral de 15%. Claramente, si la intención fuera minimizar el error muestral, la mejor opción sería el censo, pero si se toma en cuenta el error de subdeclaración, la decisión es menos obvia, sobre todo cuando los márgenes de error superan en todos los casos el 34 por ciento.
![](/img/revistas/ete/v75n300//2448-718X-ete-75-300-843-gch4.jpg)
Gráfica 4 Discrepancia en el valor del ingreso del municipio de Jesús María (Ags.) al comparar distintas fuentes de información(representativa y no representativa)
La conclusión que se infiere de estos datos descriptivos es que, con las bases de datos actualmente disponibles en México, las posibilidades de obtener indicadores de ingresos estatales y municipales con un mínimo de precisión y detalle son muy limitadas. Afortunadamente, puede darse un paso hacia adelante en este sentido aplicando las técnicas estadísticas elaborados en particular para este propósito.
II. Antecedentes en la bibliografía
El problema descrito e ilustra do líneas arriba ha motivado el avance de investigaciones y metodologías desde hace varios decenios. En realidad, los primeros antecedentes se remontan a los años cincuenta —véase por ejemplo, el estudio precursor de Hansen, Hurwitz y Madow (1953), quienes son los primeros en utilizar análisis de regresión para mejorar la eficiencia de estimadores de áreas pequeñas. Moore (1952) y Hartley (1958) proponen otra técnica que simplifica el método de máxima verosimilitud para agregar información con bases en datos incompletas, y a partir de ese momento existe un flujo intermitente de estudios del tema.4
A principios de los años noventa, Angrist y Krueger (1992) combinan el censo de población de los Estados Unidos de 1960 con el de 1980 con el fin de medir la relación entre los años de escolaridad y la edad en la que una persona se incorpora a la enseñanza formal. Para combinar las fuentes de información utilizan estimado res de variables instrumentales que están en función de las matrices de varianza-covarianza. Los instrumentos se construyen a partir de variables dicotómicas relacionadas con el año de nacimiento de cada persona. Por su parte, Arellano y Meghir (1992) combinan la encuesta del gasto de las familias y la encuesta de la fuerza laboral del Reino Unido correspondientes a 1983. Estiman un modelo de optimación in ter temporal de oferta laboral para las mujeres con variables existentes en ambas fuentes. De manera similar, Alderman et al (2002) combinan la encuesta de ingreso y gasto de hogares de Sudáfrica para 1995, con el censo de población de 1996 para calcular indicadores desagregados de bienestar.
Recientemente, Elbers, Lanjouw y Lanjouw (2003) proponen un método similar al de estimación de áreas pequeñas, extendiendo la metodología con el desarrollo de estimado res de población con funciones no lineales para los cuales es necesario considerar medidas se mi paramétricas y no paramétricas. Esta técnica se ha aplica do en distintos países, entre los que se encuentran Tailandia, Cambodia, Sudáfrica, Brasil, Nicaragua, Madagascar, Guatemala y Ecuador, entre otros. La presente investigación se apoya en esta metodología, y la seccion III la describe de manera detallada.
Antecedentes en México
En México se han hecho pocos estudios relacionados con esta bibliografía. Tres ejemplos concretos son los trabajos de Hernández (1996), INEGI (2000) y Sedesol (explicado en Hernández y Székely, 2005). Hernández (1996) estima la oferta laboral y la pobreza en las zonas urbanas de México. Par te de la información de la ENIGH para imputar ingresos de los hogares a los registros de la ENEU.5 Primero identifica las variables comunes para los hogares urbanos contenidas en ambas bases de datos, para después estimar un modelo To bit del ingreso no laboral con el fin de captar los parámetros estimados de dicho ingreso y predecir el ingreso no laboral en la ENEU.
Por su parte, el INEGI (2000) realiza una estimación de la pobreza por localidades pequeñas en México. Identifica variables comunes entre el Censo de Población y Vivienda del 2000 y la ENIGH 2000, para estimar dos modelos logit en los que la variable dependiente es la condición de pobreza y las variables independientes son las variables comunes entre el censo y la ENIGH. Se descartan las variables que no resultan significativas al modelo y también las que no contribuyen a explicar la varianza original. Paralelamente utilizan análisis discriminante y estimaciones de área pequeña tradicionales para intentar comparar sus estimaciones logísticas con dichas técnicas. La conclusión que obtienen de este ejercicio es que los modelos logit, así como el análisis discriminante, arrojan resultados similares, es decir, la coincidencia de hogares con las distintas técnicas es alrededor de 80%. Cabe aclarar que al tratar se de la población en pobreza, el análisis discriminante identifica un poco mejor a los hogares en esta condición que el modelo logit, sin embargo, el modelo logístico se ajusta mejor en el plano nacional para los hogares pobres y no pobres.
En cuanto al método empleado por la Sedesol, el procedimiento consiste en identificar a los hogares pobres de localidades pequeñas mediante un sistema de punta je que se construye con los coeficientes de una serie de variables explicativas estandarizadas. El análisis discriminante que se aplica permite encontrar un algoritmo matemático para clasificar a los hogares respecto a su per fil al minimizar el error de clasificación (o minimizan do el error). Para utilizar este método se requiere definir una probabilidad a priori de pertenencia a cierto grupo —por ejemplo, el de población en pobreza— para después obtener una probabilidad final (a posteriori) de pertenencia. La probabilidad final depende de la función de distribución conjunta de las variables explica ti vas y de las probabilidades iniciales.
Existen tanto ventajas como desventajas en la utilización de cada una de estas tres técnicas. Por ejemplo, suponer en ambos casos distribuciones normales o logísticas facilita el análisis con respecto a las distribuciones: ambas son simétricas y sus funciones de máxima verosimilitud son globalmente cóncavas. Más aún, si la distribución de la población presenta una concentración mayor en los extremos, en comparación con la distribución normal, la representación logística llega a ser una distribución más flexible para la exploración de variables. Sin embargo, a pesar de tener la posibilidad de flexibilizar supuestos respecto a los extremos de las distribuciones, aún se utiliza el supuesto de una distribución paramétrica de la información. Por tal motivo, la metodología que utilizamos en esta investigación considera estimaciones se mi paramétricas y no paramétricas para hacer frente a esta limitación en particular. Esta metodología fue propuesta por Elbers, Lanjouw y Lanjouw (2003) (ELL de aquí en adelante) y será adoptada en esta investigación para el caso de México con el objetivo de mejorar la precisión y el detalle de los indicadores de bienestar, en particular, el ingreso de los hogares.
III. Aspectos metodológicos de la imputación de ingresos
La metodología de imputación supone que si un indicador de bienestar W depende de la variable de interés —en este caso el ingreso per capita del hogar y h — a partir de la encuesta de hogares y el censo de población se puede obtener la distribución conjunta de y h y una serie de variables independientes x h . Esto es, el método consiste en tomar la encuesta de hogares como una muestra aleatoria de la población representa da en el censo, de manera que las variables independientes x h se encuentren disponibles en ambas fuentes. De esta manera se generan estimaciones puntuales y errores de predicción del vector y h .
El primer paso de instrumentación consiste en obtener un modelo de predicción de ingresos. Así, la variable y ch , el ingreso del hogar h que reside en la comunidad c, se estima linealmente como:
en que el vector de errores se distribuye como u ~ F (0, Σ). Es importante notar que el vector β carece de toda interpretación económica. El vector β podría estar sesgado, dado que algunas de las variables consideradas pueden ser endógenas. Sin embargo, si éstas contribuyen a reducir el error de predicción pueden permanecer en la modelación de los ingresos del hogar. El error se puede desagregar en:
en que η c corresponde al error de la comunidad c y ε ch corresponde al error intrínseco del hogar h que vive en la comunidad c. Suponer dicha estructura del error permite la correlación entre errores dentro de los conglomerados.
Las especificaciones en (1) y (2) forman conjuntamente lo que se conoce en la bibliografía como un “modelo lineal jerárquico” (véase Wooldridge, 2003). Es necesario suponer que ambos componentes en (2), el correspondiente a la comunidad y el que se refiere al hogar, no están correlacionados entre sí. Si una mayor proporción del error total corresponde al factor de localidad, las estimaciones serán de menor precisión y no se ganará mucho en agregar más hogares en la lo calidad. La manera de reducir el componente inherente a la lo calidad consiste en agregar a la estimación de los ingresos variables que correspondan a ésta y que no estén relacionadas con otras localidades. Variables que no sólo expliquen la condición de ciertos niveles de ingreso por el hecho mismo de pertenecer a dicha lo calidad, sino también que logren captar la heterogeneidad entre las localidades.6
Debido al pequeño número de conglomerados en una encuesta de hogares, la heteroscedasticidad en los errores correspondientes al componente del conglomerado es poco factible, como se explica en ELL.7 Además, en el estudio presente, no basta decir que el número de conglomerados (municipios) seleccionados al ser pequeño ha ce poco viable la existencia de errores heteroscedásticos, sino también que la selección de las regiones consideradas fue realizada con el criterio de marginación utilizando la técnica de Dalenius (veáse mayores pormenores en la subsección 1).
En suma, la metodología utilizada en este estudio se centra en la minimización del valor de los dos componentes del error total de predicción en (2). Además, el modelo permite corregir por heteroscedasticidad de los errores inherentes al hogar (idiosincrásicos).
1. La metodología en la práctica
Para aplicar la metodología de ELL al caso de México es necesario que previamente se definan las regiones para las cuales se realizarán las estimaciones de ingreso. En la actualidad, el INEGI ha reconocido las diversas agrupaciones de estados según criterios del índice de desarrollo humano, índice de marginación y niveles de bienestar, sin definir estrictamente alguna de ellas como oficial. En este estudio se decidió utilizar la estratificación con el criterio del índice de marginación conformando los grupos por medio de la técnica de estratificación sugerida por Dalenius y Hodges (1959).8 Esta técnica fue empleada para generar conjuntos homogéneos de acuerdo con el valor del índice de marginación. La manera en la que se realizó fue con la estratificación de cuatro a siete estratos, obteniendo la distribución de viviendas de la ENIGH para cada estratificación. Se considera ron cinco estratos como el número adecuado para la agregación, puesto que al incrementar el número de estratos se reducía la muestra a menos de mil viviendas por estrato. Este ejercicio realizado por INEGI arroja la siguiente agrupación:
Región 1 (marginación muy baja): Aguascalientes, Baja California, Baja California Sur, Coahuila, Chihuahua, Distrito Federal y Nuevo León.
Región 2 (marginación baja): Colima, Jalisco, Estado de México, Sonora y Tamaulipas.
Región 3 (marginación media): Durango, Guanajuato, Morelos, Nayarit, Querétaro, Quintana Roo, Sinaloa, Tlaxcala y Zacatecas.
Región 4 (marginación alta): Campeche, Hidalgo, Michoacán, Puebla, San Luis Potosí, Tabasco y Yucatán.
Región 5 (marginación muy alta): Chiapas, Guerrero, Oaxaca y Veracruz.
Una vez seleccionadas las regiones geográficas, utilizando la información de la ENIGH 2000 y del Censo Nacional de Población y Vivienda de ese mismo año, se comenzo con una etapa preliminar de selección de variables (etapa 0) y de dos etapas de estimación de ingresos y errores.
2. Etapa cero
Un paso previo al proceso de imputación consiste en la selección de variables comunes entre el censo y la ENIGH. Para mayor comparabilidad entre la encuesta y el censo se recomienda el levantamiento de ambas fuentes de información en el mismo año. Como se mencionó líneas arriba, en este artículo se hará uso de la información para 2000. Para asegurar la comparabilidad entre ambas fuentes, se requiere hacer otras pruebas como son:
a) Comparación de cuestionarios, identifican do aquellas preguntas conceptualmente idénticas o similares entre las dos fuentes de información. En la selección de estas preguntas de be considerar se el levantamiento de datos para los mismos grupos de la población. Por ejemplo, si se considera alfabetismo en el hogar, que sea para el mismo grupo de edad en ambas bases de datos.
b) Las variables seleccionadas con el criterio anterior se so me ten a la comparación estadística de sus distribuciones para cada región geográfica. Se requiere la comparación de medias muestra les contra la media poblacional para las variables cuantitativas seleccionadas con base en pruebas de significación estadística. Aquellas no rechazadas como iguales a las poblacionales son consideradas para la modelación. El criterio de selección para las variables cualitativas es que el valor promedio de las variables en el censo estén dentro del intervalo de confianza correspondiente al de la encuesta. Los estadísticos anteriores son calcula dos para cada una de las regiones geográficas divididas en rural y urbano. Para el caso de la encuesta, el cálculo de la varianza para cada variable fue realizada considerando la elaboración muestral de la encuesta, pon de ran do por el respectivo factor de expansión poblacional del hogar (véase INEGI, 2001).
Para el caso de México, la lista de variables conceptual y estadísticamente comparables entre la ENIGH 2000 y el Censo 2000 es la siguiente: i) características de la vivienda: disponibilidad de agua, disponibilidad de electricidad, combustible para cocinar, material en pisos, material en muros, material en techos, cuarto para cocinar, disponibilidad de drenaje y tenencia de la vivienda; ii) artículos de la vivienda: teléfono, radio, televisión, videocasetera, licuadora, refrigerador, lavadora, calentador de agua, automóvil o camioneta propios y computadora; iii) características sociodemográficas: sexo, edad, estado civil, parentesco, asistencia escolar, alfabetismo y escolaridad, y iv) características laborales: condición de actividad, ocupación, horas trabajadas y posición en el trabajo.
A partir de las variables mencionadas se construye el conjunto de variables explicativas (originales y compuestas) para cada región geográfica con distinción entre zonas rurales y urbanas con el criterio de 15 mil habitantes.
3. Etapa uno
Una vez seleccionadas las variables explicativas se realiza una transformación logarítmica al ingreso per capita de los hogares proveniente de la encuesta.9 Este ingreso fue construido con base en los criterios establecidos por el Comité Técnico para la Medición de la Pobreza (CTMP) para hacerlo comparable con las estimaciones oficiales de pobreza. De igual manera, se consideró el ingreso neto total, puesto que la encuesta sólo permite realizar desagregaciones confiables cuando se toman en cuenta por agregado los ingresos monetarios y no monetarios para conformar el ingreso total. Si se utilizara únicamente el ingreso laboral o el ingreso no laboral, perderíamos precisión y aumentaríamos la variabilidad de los ingresos, puesto que es una encuesta creada para captar esencialmente el ingreso y el gasto corriente total de los hogares nacionales, urbanos y rurales.
Se estima un modelo de regresión por mínimos cuadrados generalizados (MCG) y se considera como variable dependiente los ingresos del hogar y como variables independientes las variables comunes entre la ENIGH y el censo. Los parámetros estimados de esa regresión se utilizan para predecir el logaritmo del ingreso per capita para cada hogar en el censo. Esto se realiza con base en las mismas variables independientes consideradas en el modelo de ingresos estimado en la encuesta, pero ahora seleccionadas en el censo. Finalmente, los “indicadores de bienestar” se construyen para los grupos de la población definidos geográficamente, utilizando las predicciones de ingreso.10
La estimación de la primera etapa implica modelar el ingreso per capita del hogar al nivel geográfico más desagregado para el cual la encuesta es representativa. En el caso de la ENIGH, esto es a nivel nacional, rural y urbano. Así, para cada región geográfica y área (rural y urbana), la primera etapa comienza con un modelo de asociación del ingreso per capita del hogar para un hogar h en la ubicación c, en que las variables explicativas son un conjunto de características observables, como se menciona en el modelo (1). En suma, se estiman diez variantes del modelo (1) según la desagregación región estrato descrita líneas arriba. Las ubicaciones corresponden a los conglomerados de la encuesta como se definen en un esquema de muestreo característico de dos etapas, y el logaritmo del ingreso per capita del hogar se modela empíricamente como:
que se deriva del modelo teórico (1). El vector de errores u se distribuye como una función F (0, Σ). El modelo se estima por mínimos cuadrados generalizados usan do los datos del hogar de la ENIGH. Para estimar el modelo MCG se obtiene la matriz de varianzas y covarianzas. El error se modela como se muestra en la especificación (2). Esta estructura de errores permite modelar la autocorrelación espacial, o “efecto de lo calidad” para hogares en la misma área, así como la heteroscedasticidad en el componente idiosincrásico del error. Ambos componentes son independientes entre sí.
En términos prácticos, para estimar Σ se genera un modelo de ingreso estimado mediante mínimos cuadrados ordinarios (MCO) y controlan do según la elaboración muestral de la encuesta, en particular, por las unidades primarias de muestreo y por el estrato muestral. La variable dependiente del modelo es el logaritmo del ingreso neto total per capita y las variables explicativas son las estrictamente comparables entre las distintas fuentes para la región en estudio. Para seleccionar las variables explicativas del modelo nos centramos en la significación de las variables, seguido por un proceso secuencial en el que se eliminan las variables que no cuentan con efecto significativo o que contribuyen poco a la R 2 ajustada.
Una vez que se obtiene el mejor modelo (1’), según los criterios mencionados, se realiza una prueba F en que interactuan las variables explicativas con los factores de expansión, para determinar la inclusión o exclusión de dichos factores. Si se rechaza la hipótesis nula de que todos los parámetros son conjuntamente iguales a 0, entonces se estima el modelo con factores de expansión. Lo contrario sucede sino se rechaza la hipótesis nula.11
Los residuales del modelo anterior son utilizados como estimadores de los errores totales û ch . Si se descompone a éstos en sus dos elementos no correlacionados entre sí, obtenemos:
Los componentes de ubicación estimados del error, dados por
Una vez especificado el modelo (1’) se incluyen variables a nivel lo calidad para minimizar el efecto localidad y disminuir los errores estándar de la estimación. Si la selección y disponibilidad de variables a nivel de lo calidad es exitosa, los indicadores de bienestar estimados en la etapa final están libres de la influencia de dichas variables. Las características de la lo calidad se construyen con el censo de población y bases externas a la ENIGH y el censo. Las variables del censo se obtienen a nivel lo calidad, municipio y estado. Mientras que para las fuentes externas el mínimo de desagregación disponible es el municipal.12
Para incluir variables a nivel conglomerado se sigue un método secuencial, que considera en la primera etapa el nivel más desagregado posible. Al primer modelo conformado por variables por hogar, inicialmente se le agregan variables por lo calidad, seguidas por las variables municipales y por último las variables por estado.
El procedimiento de selección de diversas variables a distintos niveles de desagregación consiste en rescatar los errores del modelo (1’), modelo con sólo variables por hogar, para después ser utilizados como variable dependiente en un modelo de regresión estimado por MCO, incluyendo únicamente como variables independientes variables dicotómicas elaboradas para cada una de las localidades dentro de la región. Antes de continuar con el proceso e identificar las variables agrupadas que contribuyen a explicar el error de localidad en el primer modelo, se realiza una prueba para confirmar que existe una explicación de dicho error con las variables agrupadas por localidad. Ésta tiene como hipótesis nula que los parámetros estimados en la regresión de los errores correspondientes a las variables dicotómicas son en conjunto iguales a 0, es decir, si la hipótesis nula no es rechazada a nivel localidad entonces las variables agrupadas a nivel lo cal no contribuyen a explicar el error del modelo (1’).Lo contrario sucede al rechazar la hipótesis de que los coeficientes estimados son en conjunto iguales a 0. Si se rechaza la hipótesis nula, el procedimiento por seguir consiste en transponer el vector de los parámetros estimados, agregados a nivel lo calidad, al mismo tiempo que se genera un factor de expansión al nivel de localidad según los hogares registrados en la encuesta.
Posteriormente se estima una regresión con MCO en la que la variable dependiente es el conjunto de parámetros estimados en la regresión anterior y las variables independientes son las variables a nivel de lo calidad. El modelo anterior es ponderado con el factor de expansión acumulado por lo calidad. Para la agregación de variables explicativas en nuestro modelo, seguimos un proceso similar al utilizado en el modelo (1’). El criterio de selección se basa en la significación estadística de las variables a nivel lo calidad y en su contribución a la R 2. Una vez identificadas las variables por lo calidad que explican parte del error a nivel de este conglomerado, regresamos al modelo (1’) para agregar las variables encontradas mediante el procedimiento anterior. Para agregar las variables a nivel municipal y estatal se sigue la misma metodología considerada para las variables a nivel localidad. Una vez que ter mina el proceso de identificación y agregación de las variables agrupadas por conglomerado geográfico, reestimamos el modelo de ingresos para obtener un modelo final minimizan do al máximo el error de lo calidad, municipio y/o estado.13
Una vez que se permite la presencia de heteroscedasticidad en el componente
específico del hogar, procedemos a modelar
Si definimos exp [
Si se considera una mayor flexibilidad en la estructura de la varianza de los
errores a nivel hogar, es necesaria la estimación del modelo (1’) por MCG. La matriz estimada de
varianza-covarianza se compone a partir de las estimaciones de los errores, se
generan dos matrices cuadradas de dimensión n, en que
n es el número de hogares en la encuesta. La primera es una
matriz en bloques, en la que cada bloque corresponde a un conglomerado, mientras
que cada celda al interior de un bloque es
La estimación de MCG resulta en un conjunto final de estimaciones de la primera etapa, β MCG , que son los coeficientes de la ecuación principal dada por (1’), así como la matriz de varianza-covarianza asociada V(β MCG ). Estos componentes son utilizados en la segunda etapa de la estimación para realizar la corrección por heteroscedasticidad.
4. Etapa dos
En esta etapa se combinan los parámetros estimados en la primera etapa con las
características observables para cada hogar en el censo, para generar un ingreso
y si mu lar los errores. Utilizando la técnica de bootstrapping
se obtiene una descripción de las propiedades muestra les de los estimado res
usan do la propia base muestral (Greene,
2003). Las simulaciones son emplea das para calcular el valor
esperado de los ingresos, la varianza del estimador de bienestar (ingreso)
debido al componente idiosincrásico por hogar y un vector de derivadas parciales
que representan el cambio del valor esperado del indicador de bienestar respecto
a los parámetros del modelo (incluyendo los que describen la distribución de los
errores). Para cada simulación r se utiliza un conjunto de
parámetros de la primera etapa. Así se obtiene un conjunto de coeficientes α y
β, de las distribuciones normales multivariadas descritas por los estimadores
puntuales de la primera etapa y sus matrices de varianza-covarianza asociadas.
El valor simulado de la varianza del error del componente de lo calidad,
Para cada hogar se obtienen términos de error simulados y sus distribuciones
correspondientes.14 Se
simula un ingreso para cada hogar, y
ch
, que es utilizado para estimar las medidas de bienestar para cada región
geográfica con distinción de localidades urbanas y rurales.15 Este proceso se repitió 100 veces obteniendo
nuevos coeficientes α, β,
5. Estimación para México
Para la aplicación al caso de México estimamos diez modelos distintos (dos para cada región), para luego utilizarlos en el proceso de imputación. Se hicieron estimaciones recurrentes probando cada una de las variables posibles. Para cada una de las diez regiones presentamos en el cuadro A2 del apéndice tanto el modelo de ingresos como la especificación del modelo de errores que disminuye la heteroscedasticidad del modelo de ingresos.
El cuadro 1 presenta la R 2 de cada una de las estimaciones finales, lo cual da una idea del poder explicativo de los modelos. En todos los casos, el modelo de ingresos genera estadísticos de R 2 aceptables, que van de .536 en la región 1 rural, a. 699 en la región 1 urbana. En comparación con otros resultados en la bibliografía, los modelos se desempeñan de manera satisfactoria. Por ejemplo, ELL generan una R 2 de. 41 para Ecuador; Elbers et al (2004) presentan un poder explicativo que va de .30 a .62 para las estimaciones de distintas regiones de Madagascar, y Durán, Benavides y Noguera (2001) registran una R 2 que va .45 a .63 para las siete regiones de Nicaragua. Los modelos de heteroscedasticidad mostrados en el cuadro 1 también presentan un poder de predicción aceptable.
Cuadro 1 R 2 para los modelos finales de ingreso y de heteroscedasticidad
Modelo de ingreso |
Modelo
de heteroscedasticidad |
||
Urbana | |||
Región 1 | 0.6993 | 0.0713 | |
Región 2 | 0.6685 | 0.1565 | |
Región 3 | 0.6391 | 0.1869 | |
Región 4 | 0.6768 | 0.0799 | |
Región 5 | 0.5958 | 0.1467 | |
Rural | |||
Región 1 | 0.5366 | 0.0799 | |
Región 2 | 0.5724 | 0.0988 | |
Región 3 | 0.5550 | 0.0264 | |
Región 4 | 0.6052 | 0.0622 | |
Región 5 | 0.5841 | 0.0647 |
Fuente: Cálculo de los autores.
Si se considera la importancia de la correlación entre conglomerados a lo largo de los diferentes modelos genera dos para cada región, se observa que la importancia del error a nivel del conglomerado “municipio” es más importante para las regiones rurales que para las urbanas. Para el caso de las estimaciones urbanas, la importancia de este error respecto al error total es similar al encontrado por la bibliografía empírica —alrededor de 3 a 7%. A pesar de ser más alto este porcentaje para el caso rural, esta importancia no es mayor a 16% del residual total.
Además, como se comentó en la etapa uno, el proceso de selección de variables a nivel conglomerado (lo calidad, municipio y estado) para los modelos finales de ingreso, se realizaron con ba se en un modelo de errores considerando los efectos de cada conglomerado para determinar si exis tía alguna parte del error que podría ser explicada por la introducción de medias de diversas variables a dichos niveles. Por ello, todos los modelos que consideran variables por localidad, municipio y/o estado, consideraron previamente si las variables desagregadas a es tos niveles tenían alguna influencia en los errores por medio de variables ficticias (dummy) a nivel de cada desagregación.
IV. Resultados: ingresos nacionales, estatales y municipales
La aplicación del proceso de imputación genera ganancias considerables en precisión y detalle para la medición del bienestar en México y, en particular, para la medición del ingreso —los recursos disponibles para los hogares—. Es posible que el resultado más ilustrativo al respecto es precisamente la estimación del ingreso promedio de los hogares. La gráfica 1 muestra que de acuerdo a la ENIGH 2000 cada una de las personas que habita en un hogar mexicano cuenta, en promedio, con un ingreso per capita mensual de 1 871 pesos. Esta es la estimación más precisa posible de los ingresos a nivel nacional, con la limitación de que el indicador sólo puede desagregarse para zonas urbanas y rurales, pero no por estado ni municipio. Por otra parte, la gráfica también muestra que el error de sub declaración de ingresos en el censo es de 48.8%, pero con la ventaja de que el indicador sí puede desglosarse a nivel local, con grandes posibilidades de desagregación geográfica. La aplicación de la metodología de imputación arroja como resultado que el ingreso per capita de la población del país es de 1 734 pesos mensuales. La ventaja respecto a las opciones anteriores es que esta cifra presenta un error de sub declaración de 7.9% —en lugar de 48.8%, es decir, un error seis veces menor al original—, pero ahora con la posibilidad de realizar desagregaciones estatales, municipales y por localidad. Claramente, existen ganancias en precisión y detalle.16
1. Ingresos por entidad federativa
El cuadro 2 presenta el ingreso promedio de las entidades federativas es tima do por el procedimiento descrito en la sección anterior. Hemos dividido a los estados de la República de acuerdo con su ingreso per capita en el año 2000, entres grupos de tamaño similar (el primero con 10 y los siguientes dos con 11 esta dos). El primer grupo se denomina de “ingreso alto”, y está conformado por los 10 esta dos de mayor ingreso, que son: el Distrito Federal, Baja California, Nuevo León, Chihuahua, Baja California Sur, Coahuila, Aguascalientes, Tamaulipas, Colima y Querétaro. El ingreso en estos casos va de 1 570 a 2 592 pesos mensuales por persona. El segundo grupo, de “ingreso medio”, incluye a los estados de Mo re los, Guanajuato, Quintana Roo, Jalisco, Sonora, Sinaloa, Estado de México, Durango, Tabasco, San Luis Potosí y Nayarit, con un rango de ingresos de entre 1 119 y 1 507 pesos mensuales por persona. Por su parte, el tercer grupo, de “ingreso bajo” —que va de 701 a 1 106 pesos mensuales por persona— está integrado por Michoacán, Yucatán, Zacatecas, Campeche, Tlaxcala, Puebla, Hidalgo, Veracruz, Guerrero, Chiapas y Oaxaca. El orden en que se enumeran corresponde a la posición de cada estado en el panorama nacional.
Cuadro 2 Ingreso per capita mensual por entidad federativa estimado por el método de imputación (2000)
Orden | Endidad federativa |
Ingreso
imputado por persona |
Porcentaje de
la población nacional |
Porcentaje del ingreso de
los hogares a nivel nacional |
Total nacional | 1 734 | |||
Estado con ingreso alto | ||||
1 | Distrito Federal | 2 592 | 0.97 | 1.84 |
2 | Baja California | 2 549 | 2.55 | 4.78 |
3 | Nuevo León | 2 355 | 0.43 | 0.75 |
4 | Chihuahua | 2 113 | 0.71 | 1.10 |
5 | Baja California Sur | 2 071 | 4.02 | 6.12 |
6 | Coahuila | 1 761 | 3.13 | 4.05 |
7 | Aguascalientes | 1 675 | 2.36 | 2.90 |
8 | Tamaulipas | 1 635 | 0.56 | 0.67 |
9 | Colima | 1 616 | 8.83 | 10.48 |
10 | Querétaro | 1 570 | 1.49 | 1.71 |
Estados con ingreso medio | ||||
11 | Morelos | 1 507 | 4.78 | 5.30 |
12 | Guanajuato | 1 489 | 3.16 | 3.46 |
13 | Quintana Roo | 1 485 | 2.29 | 2.50 |
14 | Jalisco | 1 402 | 6.49 | 6.68 |
15 | Sonora | 1 396 | 13.43 | 13.78 |
16 | Sinaloa | 1 364 | 4.09 | 4.10 |
17 | Estado de México | 1 264 | 1.60 | 1.48 |
18 | Durango | 1 159 | 0.94 | 0.80 |
19 | Tabasco | 1 149 | 3.93 | 3.32 |
20 | San Luis Potosí | 1 120 | 3.53 | 2.90 |
21 | Nayarit | 1 119 | 5.21 | 4.28 |
Estados con ingreso bajo | ||||
22 | Michoacán | 1 106 | 1.44 | 1.17 |
23 | Yucatán | 1 036 | 0.90 | 0.68 |
24 | Zacatecas | 1 030 | 2.36 | 1.79 |
25 | Campeche | 1 014 | 2.60 | 1.94 |
26 | Tlaxcala | 987 | 2.27 | 1.65 |
27 | Puebla | 982 | 1.94 | 1.40 |
28 | Hidalgo | 918 | 2.82 | 1.91 |
29 | Veracruz | 917 | 0.99 | 0.67 |
30 | Guerrero | 801 | 7.09 | 4.17 |
31 | Chiapas | 714 | 1.70 | 0.89 |
32 | Oaxaca | 701 | 1.39 | 0.71 |
Fuente: Cálculo de los autores. Pesos a precios de agosto de 2000.
Las dos últimas columnas del cuadro muestran tan to la proporción de población que habita en cada estado, como el porcentaje de ingreso de los hogares que genera cada entidad federativa. Los casos en los que se presenta una mayor diferencia entre la contribución a la población y la contribución al ingreso son Baja California, Baja California Sur y Colima, que generan mayor ingreso proporcionalmente a su población, y Guerrero, en donde habita prácticamente el 7.1% de la población nacional, pero que solamente genera 4.1% del ingreso.
Al comparar el orden de esta dos de acuerdo con el ingreso imputado, con los ingresos originales registrados en el censo, en la ENE e incluso en las cuentas nacionales (a diferencia de las primeras dos fuentes de información, en este caso la comparación se realiza con el PIB), se encuentra un panorama muy distinto (véase cuadro 3).
Cuadro 3 Ingreso per capita mensual por entidad federativa estimado de distintas fuentes
Censo de población 2000 | ENE 3er trimestre 2000 | Producto interno bruto | ||||||||
Entidad |
Ingreso mensual per capita |
Entidad |
Ingreso mensual per capita |
Entidad |
Ingreso mensual per capita |
|||||
1 | Baja California | 2 762 | 1 | Baja California | 3 120 | 1 | Distrito Federal | 10 864 | ||
2 | Chihuahua | 2 064 | 2 | Nuevo León | 2 182 | 2 | Nuevo León | 7 671 | ||
3 | Baja California Sur | 2 060 | 3 | Distrito Federal | 2 057 | 3 | Campeche | 7 186 | ||
4 | Distrito Federal | 1 974 | 4 | Baja California Sur | 1 913 | 4 | Quintana Roo | 6 645 | ||
5 | Nuevo León | 1 918 | 5 | Coahuila | 1 893 | 5 | Chihuahua | 6 239 | ||
6 | Tamaulipas | 1 685 | 6 | Tamaulipas | 1 870 | 6 | Baja California | 6 060 | ||
7 | Coahuila | 1 645 | 7 | Sonora | 1 759 | 7 | Coahuila | 5 645 | ||
8 | México | 1 643 | 8 | Sinaloa | 1 732 | 8 | Aguascalientes | 5 443 | ||
9 | Sonora | 1 597 | 9 | Quintana Roo | 1 688 | 9 | Baja California Sur | 5 298 | ||
10 | Quintana Roo | 1 481 | 10 | Colima | 1 556 | 10 | Querétaro | 5 123 | ||
11 | Querétaro | 1 417 | 11 | Chihuahua | 1 524 | 11 | Sonora | 5 009 | ||
12 | Aguascalientes | 1 400 | 12 | Querétaro | 1 466 | 12 | Tamaulipas | 4 670 | ||
13 | Jalisco | 1 380 | 13 | Aguascalientes | 1 413 | 13 | Jalisco | 4 234 | ||
14 | Colima | 1 220 | 14 | México | 1 307 | 14 | Colima | 4 185 | ||
15 | Sinaloa | 1 128 | 15 | Jalisco | 1 300 | 15 | Morelos | 3 564 | ||
16 | Guanajuato | 1 065 | 16 | Durango | 1 268 | 16 | Yucatán | 3 479 | ||
17 | Morelos | 1 045 | 17 | Guanajuato | 1 211 | 17 | Durango | 3 447 | ||
18 | Durango | 1 000 | 18 | Nayarit | 1 179 | 18 | México | 3 201 | ||
19 | Nayarit | 944 | 19 | Campeche | 1 163 | 19 | Sinaloa | 3 172 | ||
20 | Michoacán | 915 | 20 | Tabasco | 1 132 | 20 | San Luis Potosí | 3 109 | ||
21 | Campeche | 912 | 21 | Yucatán | 1 095 | 21 | Puebla | 3 076 | ||
22 | Puebla | 877 | 22 | Morelos | 1 072 | 22 | Guanajuato | 3 053 | ||
23 | Yucatán | 866 | 23 | Michoacán | 1 067 | 23 | Tabasco | 2 655 | ||
24 | Zacatecas | 858 | 24 | Veracruz | 1 042 | 24 | Hidalgo | 2 422 | ||
25 | Tabasco | 855 | 25 | San Luis Potosí | 1 035 | 25 | Veracruz | 2 391 | ||
26 | San Luis Potosí | 820 | 26 | Tlaxcala | 1 016 | 26 | Nayarit | 2 389 | ||
27 | Veracruz | 798 | 27 | Puebla | 984 | 27 | Michoacán | 2 319 | ||
28 | Hidalgo | 770 | 28 | Hidalgo | 921 | 28 | Guerrero | 2 318 | ||
29 | Tlaxcala | 744 | 29 | Guerrero | 884 | 29 | Tlaxcala | 2 295 | ||
30 | Guerrero | 722 | 30 | Zacatecas | 763 | 30 | Zacatecas | 2 208 | ||
31 | Chiapas | 621 | 31 | Chiapas | 717 | 31 | Oaxaca | 1 790 | ||
32 | Oaxaca | 546 | 32 | Oaxaca | 597 | 32 | Chiapas | 1 726 |
Fuente: Cálculo de los autores. Pesos a precios de agosto de 2000.
Cuando la comparación se realiza con los datos censales, los mayores cambios de posición relativa se observa, por un lado, en el Estado de México, Sonora y Puebla, que pierden 9, 6 y 5 posiciones, respectivamente. Por el otro, en Tabasco, San Luis Potosí y Morelos ganan seis posiciones cada uno, mientras que en Colima y Aguascalientes ganan cinco. Estos cambios provienen de reducir el error de subestimación de ingresos en los censos.
La segunda columna del cuadro 3 presenta el ordenamiento de acuerdo con el ingreso original captado por la ENE. También en este caso se observan varios cambios. Los estados de Mo re los, Chihuahua, Zacatecas y Aguascalientes ganan de 6 a 11 posiciones, mientras que Sinaloa y Sonora pierden 8 posiciones, y Campeche y Veracruz pierden 6 y 5 posiciones, respectivamente. Estos reordenamientos reflejan el efecto de reducir el error de subestimación inherente en la ENE y, en menor medida, reflejan también la eliminación del error muestral de esta encuesta.
La tercera columna presenta el orden estatal de acuerdo con el PIB per capita mensual de 2000. La diferencia entre el ingreso imputado y el PIB es que este último incluye una variedad de ingresos adicionales a los ingresos de los hogares, como son el gasto gubernamental, el pago de la deuda, las exportaciones, etc. En este caso, la comparación también arroja cambios drásticos: Campeche, Quintana Roo y Yucatán pierden 22, 9 y 7 lugares, respectivamente, mientras que Guanajuato y Zacatecas ganan 10 y 6 lugares. Nayarit, Michoacán y Colima ganan 5 lugares cada uno.
El mapa 1 registra los ingresos de la República Mexicana, utilizando la clasificación del cuadro 2. Puede observarse que existe una clara pauta geográfica de los ingresos. Las entidades federativas de ingreso alto se encuentran concentradas en el norte del país —a excepción del Distrito Federal, Aguascalientes, Colima y Querétaro— mientras que las de ingreso bajo se concentran en el sur —con las excepciones de Michoacán y Zacatecas. Por su parte, la mayoría de los estados con ingreso medio se encuentran en la zona centro.
2. Ingresos por municipio
El cuadro 4 presenta la información para los 30 municipios —incluyendo a las delegaciones del Distrito Federal— de mayor y menor ingreso, respectivamente, a nivel nacional.17 El municipio (o su equivalente) en el Distrito Federal con mayor ingreso es la delegación Benito Juárez, con un ingreso per capita mensual de 5 248 pesos. Le siguen San Pedro Garza García de Nuevo León con 4 591 y la delegación Miguel Hidalgo con 3 756 pesos mensuales por persona. Cabe destacar que entre los diez municipios con mayor ingreso, cinco pertenecen al Distrito Federal, tres a Nuevo León, uno a Tamaulipas y uno a Baja California. A medida que se avanza en la lista, aparecen municipios de otros estados como Morelos, el Estado de México y Chihuahua, pero aun así, de entre los 30 municipios con mayor ingreso, es notorio que más de la mitad se encuentran en el Distrito Federal o en Nuevo León.
Cuadro 4 Municipios con mayor y menor ingreso
Municipios con mayor ingreso en el país | Municipios con menor ingreso en el país | |||||
Municipio | Estado |
Ingreso
promedio imputado por municipio |
Municipio | Estado |
Ingreso
promedio imputado por municipio |
|
Benito Juárez | Distrito Federal | 5 248 | Eloxochitlan | Puebla | 170 | |
San Pedro Garza García | Nuevo León | 4 591 | Hueytlalpan | Puebla | 189 | |
Miguel Hidalgo | Distrito Federal | 3 756 | Vicente Guerrero | Puebla | 210 | |
Coyoacán | Distrito Federal | 3 534 | Tahdziu | Yucatán | 212 | |
San Nicolás de los Garza | Nuevo León | 3 018 | Tlapacoya | Puebla | 216 | |
Ciudad Madero | Tamaulipas | 2 981 | Chichiquila | Puebla | 219 | |
Cuauhtémoc | Distrito Federal | 2 966 | San Sebastián Tlacotepec | Puebla | 221 | |
Tlalpan | Distrito Federal | 2 943 | Chiconcuautla | Puebla | 221 | |
Mexicali | Baja California | 2 736 | San Simón Zahuatlán | Oaxaca | 221 | |
Los Aldamas | Nuevo León | 2 720 | Coicoyan de las Flores | Oaxaca | 226 | |
Azcapotzalco | Distrito Federal | 2 671 | San Felipe Tepatlán | Puebla | 230 | |
Cuernavaca | Morelos | 2 663 | Huehuetla | Puebla | 232 | |
Monterrey | Nuevo León | 2 621 | Zoquitlán | Puebla | 233 | |
Tijuana | Baja California | 2 604 | Olintla | Puebla | 234 | |
Huixquilucan | Estado de México | 2 591 | Tepetzintla | Puebla | 237 | |
Chihuahua | Chihuahua | 2 590 | Ixtepec | Puebla | 237 | |
Álvaro Obregón | Distrito Federal | 2 574 | Camocuautla | Puebla | 238 | |
Metepec | Estado de México | 2 537 | Chilchotla | Puebla | 239 | |
Cuajimalpa de Juárez | Distrito Federal | 2 499 | San Martín Peras | Oaxaca | 244 | |
Los Herreras | Nuevo León | 2 489 | Tehipango | Veracruz | 244 | |
Victoria | Tamaulipas | 2 459 | San Lorenzo Texmelucan | Oaxaca | 245 | |
Venustiano Carranza | Distrito Federal | 2 446 | Quimixtlán | Puebla | 246 | |
Moroleón | Guanajuato | 2 442 | Aquismón | San Luis Potosí | 247 | |
Iztacalco | Distrito Federal | 2 414 | Coyomeapan | Puebla | 248 | |
Cerralvo | Nuevo León | 2 399 | Ahuacatlán | Puebla | 249 | |
Magdalena Contreras | Distrito Federal | 2 383 | Santos Reyes Yucuna | Oaxaca | 249 | |
Querétaro | Querétaro | 2 378 | Hermenegildo Galeana | Puebla | 253 | |
Guadalupe | Nuevo León | 2 377 | San Miguel Tilquiápan | Oaxaca | 254 | |
Juárez | Chihuahua | 2 374 | Metlatónoc | Guerrero | 255 | |
Naucalpan de Juárez | Estado de México | 2 352 | Santa Catarina | San Luis Potosí | 255 |
Fuente: Cálculos de los autores.
En la parte derecha del cuadro se presentan los casos de menor ingreso por persona. El municipio que registra el ingreso más bajo en el país, es el de Eloxochitlan en el estado de Puebla, con 170 pesos al mes, seguido por Hueytlalpan y Vicente Guerrero, en el mismo estado de Puebla, con sólo 189 y 210 pesos. La diferencia entre el municipio de mayor ingreso —Benito Juárez— y el de menor ingreso —Eloxochitlan— es de casi 31 veces. De entre los 30 municipios de menor ingreso, destaca el hecho de que casi dos terceras partes —es decir, 19 municipios— se encuentran ubicados en el estado de Puebla. El siguiente estado con mayor número es Oaxaca, con 7 municipios.
El mapa 2 registra los ingresos municipales de México. Al igual que con la clasificación por entidad federativa, existe un clara pauta geográfica, en que los municipios de ingreso alto se concentran en el norte, los de ingreso bajo en el sur y los de ingreso medio en la zona centro, aunque para éstos también se observa un número importante ubicado en el sur del país.
V. Estimación del índice de desarrollo humano
El método de imputación de ingresos empleado en este artículo permite el cálculo de una variedad de indicadores de bienestar adicionales al ingreso, con mayor precisión y detalle que lo que permite las fuentes de información tradicionales. Por ejemplo, como se mencionó en la Introducción, permite refinar índices ampliamente utilizados como los de marginación, los de bienestar, o el índice de masas carencia les. Pero además permite desagregar otros indicadores como la pobreza, la desigualdad o los índices de desarrollo humano publicados por el Programa de Naciones Unidas para el Desarrollo.
En 2003 el PNUD presentó el Primer Informe Sobre Desarrollo Humano para México, en el que se incluyó el índice nacional y los índices estatales.18 Por carecer de una medida confiable de ingresos, no se publicó un IDH municipal. En esta sección presentamos precisamente el IDH municipal utilizando los ingresos imputados.
1. Cálculo del IDH
El IDH se compone de tres dimensiones: salud, educación e ingreso. El cuadro 5 especifica las variables que originalmente utiliza el PNUD en sus cálculos por municipio. Debido a las limitaciones en la disponibilidad de información municipal, el cálculo del IDH requiere algunas adaptaciones para hacerlo viable para México.
Cuadro 5 Variables utilizadas para calcular el IDH
Dimensión |
Indicador
establecido por Naciones Unidas |
Indicador
utilizado a nivel municipal |
Salud | Esperanza de vida al nacer | Probabilidad de sobrevivir el primer año de edad |
Educación | Tasa de matriculación escolar | Tasa de asistencia escolar |
Tasa de alfabetización | Tasa de alfabetización | |
Ingreso | PIB per capita en dólares ajustado por paridad de poder de compra | Ingreso per capita ajustado por paridad de poder de compra |
Fuente: PNUD (2003).
En el caso de la dimensión de salud, la esperanza de vida al nacer se sustituye por la probabilidad de sobrevivir al primer año de vida. Ésta se obtiene como el complemento de la tasa de mortalidad infantil.19 En la dimensión de educación la tasa de asistencia escolar sustituye a la tasa de matriculación escolar. La tasa de asistencia escolar corresponde a la población entre 6 y 24 años de edad que asiste a la escuela entre la población en el mismo rango de edad. La tasa de alfabetización se obtiene a partir del número de personas de 15 y más años de edad que saben leer y escribir, entre el número de personas de 15 y más años de edad.
En la dimensión de ingreso se utiliza el ingreso per capita imputado anualizado para cada municipio. Éste se multiplica por un factor igual para todos los municipios, para hacer el ingreso total equivalente al PIB per capita nacional, y el resultado se ajusta median te un factor de con versión a términos de paridad de poder de compra (PPC) en dólares estadunidenses. Mediante los dos ajustes anteriores se asegura la congruencia con el IDH nacional y estatal publicado en PNUD (2003).
Para normalizarlos indicadores de educación, salud e ingreso seguimos la metodología tradicional del IDH, con lo cual los datos municipales de México se hacen comparables con el IDH de otros países y regiones del mundo. En el caso de la dimensión de salud, el valor máximo posible es el valor máximo histórico de sobrevivencia infantil, que corresponde al observado para Japón. El valor mínimo se obtiene mediante la siguiente fórmula:
en que IEV nac es el índice de esperanza de vida nacional, SI nac es el valor correspondiente a la sobrevivencia infantil nacional, SI max es el valor correspondiente al máximo histórico observado, Mn es el número de municipios en el país y Pm corresponde al porcentaje de población de cada municipio. Los parámetros utilizados en las dimensiones de educación e ingreso corresponden a los establecidos por las Naciones Unidas.
Una vez obtenidas las variables normaliza das se calcula el índice para cada dimensión para ser agregadas posteriormente con el mismo peso en el IDH. El cuadro 6 resume el procedimiento por indicador.
Cuadro 6
Dimensión | Índice en cada dimensión | IDH |
Salud |
En que IS corresponde al índice salud, IE al de educación e II al índice ingreso |
|
Educación | Índice de educación = [2/3(índice de alfabetización de adultos) + 1/3(índice de asistencia escolar)] | |
Ingreso |
|
2. El IDH por municipio
El cuadro 7 presenta el IDH para los 30 municipios con mayor y menor valor del índice en 2000, respectivamente.20 Las diferencias con el cuadro 4 provienen de la inclusión de indicadores de educación y salud, adicionales al ingreso. El panorama general que se obtiene de estos resultados es el siguiente: de los 30 municipios de mayor IDH, 10 se encuentran en el Distrito Federal —al igual que en el caso del ingreso— y el municipio que aparece en primer lugar es la delegación Benito Juárez. El resto son 4 en Oaxaca, 3 en Nuevo León y el Estado de México, 2 en Querétaro e Hidalgo y uno en Morelos, Chihuahua, Tlaxcala, Tamaulipas, Veracruz, Zacatecas, respectivamente.
Cuadro 7 Índice de desarrollo humano municipal
Entidad federativa | Municipio | IDH | Entidad federativa | Municipio | IDH | |||
Nacional | 0.7965 | |||||||
Municipios con mayor IDH | Municipios con menor IDH | |||||||
1 | Distrito Federal | Benito Juárez | 0.9136 | 1 | Guerrero | Metlatónoc | 0.3886 | |
2 | Nuevo León | San Pedro Garza García | 0.8897 | 2 | Oaxaca | Coicoyan de las Flores | 0.3952 | |
3 | Distrito Federal | Coyoacán | 0.8809 | 3 | Veracruz | Tepehuipango | 0.4046 | |
4 | Distrito Federal | Miguel Hidalgo | 0.8788 | 4 | Veracruz | Mixtla de Altamirano | 0.4185 | |
5 | Distrito Federal | Cuauhtémoc | 0.8671 | 5 | Oaxaca | San Simón Zahuatlán | 0.4286 | |
6 | Nuevo León | San Nicolás de los Garzas | 0.8634 | 6 | Chiapas | Sitalá | 0.4434 | |
7 | Morelos | Cuernavaca | 0.8611 | 7 | Oaxaca | Santta Lucía Miahuatlán | 0.4444 | |
8 | Oaxaca | Santa María del Tule | 0.8609 | 8 | Chiapas | Santiago el Pinar | 0.4497 | |
9 | México | Metepec | 0.8601 | 9 | Oaxaca | Santa María de Asunción | 0.4587 | |
10 | Distrito Federal | Tlalpan | 0.8588 | 10 | Chiapas | Aldama | 0.4634 | |
11 | Querétaro | Querétaro | 0.8560 | 11 | Oaxaca | Santiago Ixtayutla | 0.4765 | |
12 | Querétaro | Corregidora | 0.8535 | 12 | Chiapas | Chalchihuitán | 0.4768 | |
13 | Chihuahua | Chihuahua | 0.8525 | 13 | Oaxaca | Huautepec | 0.4799 | |
14 | Distrito Federal | Azcapotzalco | 0.8523 | 14 | Oaxaca | Santo Domingo Tepuxtepec | 0.4810 | |
15 | Oaxaca | Santa Lucía del Camino | 0.8518 | 15 | Chiapas | Mitontic | 0.4843 | |
16 | Oaxaca | San Sebastián Tutla | 0.8514 | 16 | Oaxaca | Santiago Amoltepec | 0.4846 | |
17 | Tlaxcala | Tlaxcala | 0.8510 | 17 | Chiapas | Chamula | 0.4854 | |
18 | Distrito Federal | Alvaro Obregón | 0.8508 | 18 | Oaxaca | Santa María Temaxcaltepec | 0.4911 | |
19 | Nuevo León | Monterrey | 0.8486 | 19 | Nayarit | Del Nayar | 0.4917 | |
20 | México | Coacalco de Berriozábal | 0.8478 | 20 | Guerrero | Xochistlahuaca | 0.4984 | |
21 | Tamaulipas | Ciudad Madero | 0.8475 | 21 | Guerrero | Atlixtac | 0.4986 | |
22 | Distrito Federal | Iztacalco | 0.8475 | 22 | Chiapas | San Juan Cancuc | 0.4996 | |
23 | Distrito Federal | Venustiano Carranza | 0.8470 | 23 | Veracruz | Astacinga | 0.5022 | |
24 | Zacatecas | Zacatecas | 0.8469 | 24 | Oaxaca | San Miguel Santa Flor | 0.5057 | |
25 | Oaxaca | Santa Cruz Amilpas | 0.8468 | 25 | Guerrero | Coanotoyac | 0.5081 | |
26 | Hidalgo | Pachuca de Soto | 0.8458 | 26 | Veracruz | Texcatepec | 0.5089 | |
27 | Veracruz | Boca del Río | 0.8456 | 27 | Guerrero | Alcozuca de Guerrero | 0.5091 | |
28 | Hidalgo | Mineral de la Reforma | 0.8421 | 28 | Guerrero | Tlacoachistlahuaca | 0.5114 | |
29 | México | Cuatitlán Izcalli | 0.8419 | 29 | Oaxaca | San Lorenzo Texmelucan | 0.5116 | |
30 | Distrito Federal | Magdalena Contreras | 0.8417 | 30 | Oaxaca | Eloxochitlan de Flores Magón | 0.5118 |
Fuente: Cálculos de los autores.
Por otra parte, el municipio con menor valor del IDH es Metlatónoc, en el estado de Guerrero, seguido por Coicoyan de las Flores en Oaxaca, y Mitla de Altamirano en Veracruz. De los 30 municipios con menor IDH, 12 están en Oaxaca, 7 en Chiapas, 6 en Guerrero, 4 en Veracruz y 1 en Nayarit. Es interesante notar que la coincidencia entre el orden por IDH y por ingresos es considerablemente baja. Un ejemplo de ello es que entre los 30 municipios con menor IDH no hay uno solo del estado de Puebla, estado que aporta más municipios con menor ingreso (véase el cuadro 4). Nuevamente, el origen de la diferencia es que el IDH incluye, además del ingreso, dos dimensiones adicionales del bienestar: la educación y la salud.
Como se dijo líneas arriba, una ventaja de la manera en la que hemos calculado el IDH estatal es que permite realizar comparaciones internacionales. Probablemente la comparación más ilustrativa es la que se realiza en los casos más extremos. Por ejemplo, utilizando los parámetros internacionales, observamos que la delegación Benito Juárez —que presenta el mayor IDH— presenta un IDH similar al de Italia. Por otra parte, el municipio de Metlatónoc, que es el de menor valor del índice, cuenta con uno similar al de Malawi, África.
Conclusiones
Este artículo presenta y adapta la metodología recién propuesta por ELL a datos de México para incrementar tan to la precisión como el detalle en la medición del bienestar de la población, específicamente, del ingreso de los hogares. Al igual que en otros países, México ha contado desde hace varios años, por un lado, con encuestas de hogares que proporciona una medición del ingreso de alta precisión, pero con muy limitadas posibilidades de desagregación geográfica, y por otro, con indicadores provenientes de los censos y conteos de población, que permiten una desagregación pormenorizada, pero que carecen de precisión en la medición, precisamente, de la variable de ingreso (hemos denominado error de subdeclaración a estas imprecisiones).
La aplicación de la metodología de imputación permite incrementar considerablemente la precisión y el detalle de una serie de indicadores de bienestar, incluyendo el ingreso, la pobreza, la desigualdad y de índices utilizados por lo común en la bibliografía y en la definición y evaluación de las políticas públicas en México, como son los índices de marginación, los índices de bienestar, el índice de masas carencia les o el índice de desarrollo humano del PNUD. Un ejemplo concreto es que al estimar el ingreso por medio del proceso de imputación propuesto por ELL se reduce el error de sub declaración inherente en el Censo Nacional de Población y Vivienda de México para 2000, de casi 49% a menos de 8% —es decir, un error seis veces menor.
Además de adaptar y utilizar la metodología para el caso de México, presentamos la primera serie de ingresos per capita de los hogares por entidad federativa y por municipio. Esta variable nos permite contar con un nuevo panorama que aporta mayor precisión y detalle que los censos, las encuestas de hogares y que otras fuentes de información como las encuestas de empleo. Utilizamos también los ingresos estimados para presentar la primera serie de índices de desarrollo humano municipal.
Nos parece que las ventajas de la utilización de la metodología de imputación son evidentes. Un siguiente paso consiste en aprovechar estos resultados para poner en el mapa a la pobreza y la desigualdad, con lo que las posibilidades de planear y evaluar de mejor manera las políticas públicas se expandirán considerablemente.