Sensibilidad de la evolución de la desigualdad a las técnicas de inferencia utilizadas. Una aplicación para el índice de Gini en el caso español (1993-2000)

García Pérez, Carmelo; Prieto Alaiz, Mercedes; García Pérez, Carmelo; Prieto Alaiz, Mercedes

Services on Demand

Journal

Article

Indicators

Cited by SciELO
Access statistics

El trimestre económico

On-line version ISSN 2448-718XPrint version ISSN 0041-3011

El trimestre econ vol.76 n.301 Ciudad de México Jan./Mar. 2009 Epub Nov 20, 2020

Artículos

Sensibilidad de la evolución de la desigualdad a las técnicas de inferencia utilizadas. Una aplicación para el índice de Gini en el caso español (1993-2000)

Carmelo García Pérez¹

Mercedes Prieto Alaiz²

^¹ Universidad de Alcalá.

^² Universidad de Valladolid.

Resumen:

Las conclusiones respecto a la evolución de la desigualdad de países o regiones se deducen, frecuentemente, de las variaciones experimentadas por las estimaciones puntuales de indicadores comunes, sin considerar el efecto de los errores muestrales en la significación estadística de los cambios. En este artículo se analiza la influencia de los diferentes métodos de inferencia (asintótica y bootstrap) del índice de Gini en la detección de variaciones interanuales de dicho indicador. Con este fin se realiza, en primer lugar, un estudio de simulación para evaluar el comportamiento de las distintas metodologías, conocidos los valores reales de los parámetros poblacionales. En segundo lugar, se aborda un estudio de sensibilidad aplicado a los datos del caso español para analizar la influencia de la técnica de inferencia sobre la definición de tendencias en el comportamiento del índice de Gini, utilizando datos del Panel de Hogares de la Unión Europea para el periodo 1993-2000.

Palabras clave: distribución personal de la renta; índice de Gini; métodos bootstrap; España

Abstract:

The conclusions regarding the evolution of inequality in countries or regions are frequently deduced from the variations experienced by the point estimations of the usual indicators, without considering the impact of sampling errors on the statistical significance of the changes detected. In this paper, we analyze the influence of different inference methods (asymptotic and bootstrap) on the Gini coefficient in detecting the inter-annual variations of this indicator. With this aim, we first carry out a simulation experiment in order to evaluate the behaviour of different methodologies, when we know the real value of the population parameters. Secondly, we present a sensitivity study, applied to data in the Spanish case, in order to analyze the influence of the inference technique on the definition of trends in the behaviour of the Gini coefficient, using data from the European Community Household Panel for the period 1993-2000.

Clasificación JEL: C15, D31, I32.

Introducción

Las conclusiones respecto a la evolución de la desigualdad se deducen, en ocasiones, de la mera variación de las estimaciones puntuales de indicadores, sin considerar que dichas estimaciones están sujetas a errores muestrales que determinan la significación estadística de los cambios interanuales. Así pues, un aumento del índice de Gini suele ser considerado como una señal inequívoca del aumento de la desigualdad de un país, sin introducir los elementos de cautela necesarios, inherentes a la interpretación de estimaciones procedentes de muestras.

Los aspectos inferenciales de los indicadores de desigualdad no eran tradicionalmente un objetivo prioritario de los investigadores, puesto que, al trabajar con muestras grandes, se consideraba que los errores estándar eran tan pequeños que no alteraban la precisión de las estimaciones y, por ende, las conclusiones obtenidas. Sin embargo, algunos autores, entre ellos ^{Maasoumi
(1997)}, destacan que los errores estándar pueden ser grandes, lo que puede cuestionar la validez de las afirmaciones realizadas. Por tanto, las conclusiones respecto a los incrementos en las estimaciones de un indicador deben basarse en contrastes de hipótesis que introduzcan la idea de significación estadística de los cambios experimentados.

Llegados al convencimiento de la necesidad de la inferencia, es importante abordar la correcta selección de las técnicas más apropiadas. Una manera de tratar la inferencia estadística en medidas de desigualdad se centra en el uso de la teoría asintótica (^{Cowell, 1989} y ^{Davidson y Duclos, 2000}). Otro enfoque consiste en aplicar técnicas bootstrap (^{Mills y Zandvakili, 1997}, y ^{Biewen,
2002}) para obtener intervalos de confianza o realizar contrastes de hipótesis.

Los argumentos en favor o en contra del uso de la teoría asintótica o de la metodología bootstrap se mencionan en numerosos trabajos, en los que se destacan sus ventajas e inconvenientes, sin deducirse una clara superioridad de una única metodología. Por tanto, resulta primordial realizar un análisis de sensibilidad que permita comprobar si las conclusiones de los estudios quedan sujetas al tipo de inferencia realizado. El análisis de sensibilidad que se propone en este trabajo consta de dos etapas: un estudio de simulación previo a la estimación y un estudio final de las estimaciones obtenidas con los datos muestrales del caso español.

El estudio pre vio de simulación consiste en la comparación de los resultados obtenidos mediante las diferentes técnicas, a partir de muestras generadas por un modelo paramétrico de la distribución personal de la renta. Este tipo de simulaciones, al conocer se los valores de los parámetros poblacionales, permite valorar el acierto de los intervalos de confianza o los contrastes de hipótesis.

La fidelidad de la forma funcional simuladora al caso particular de estudio es un aspecto importante, dado que la función específica, adoptada como modelo de la distribución, determina los resultados obtenidos para las diferentes estimaciones. Este elemento resulta determinante en aspectos tales como la sensibilidad de los indicadores de desigualdad a los valores extremos (^{Davidson y Duclos, 2000}), hecho que requiere una correcta modelización de las colas.

El análisis de sensibilidad a posteriori con los datos reales de un caso supone utilizar diferentes técnicas de inferencia que generarán un conjunto de estimaciones por intervalos o un conjunto de resultados de los contrastes de hipótesis. Con este tipo de análisis podrán obtenerse conclusiones comparativas entre los diferentes resultados, aunque no puede calibrarse el acierto de las afirmaciones realizadas, por el obvio desconocimiento de los valores de los parámetros poblacionales.

Este esquema doble de análisis se aplica, en este trabajo, a la evolución del índice de Gini en España, según los datos del Panel de Hogares de la Unión Europea (Phogue), en el periodo 1993-2000. Así pues, se realizará, en primer lugar, un estudio de simulación, con el que se pretende estudiar el funcionamiento de las diferentes técnicas con muestras extraídas de una población que sigue un modelo Dagum de tipo I, modelo que, según numerosos trabajos (^{García, 2006}; ^{García, Callealta
y Núñez, 2006}; ^{Prieto, 1998}; ^{Pena et al, 1996}), proporciona el mejor ajuste a la distribución empírica del caso español. En segundo lugar, se realizará un estudio empírico de la repercusión de las diferentes técnicas de inferencia (bootstrap y asintóticas) en los intervalos de confianza y los contrastes de hipótesis realizados para comparar índices de Gini, utilizando las muestras reales del caso español.

La estructura del artículo es la siguiente. En la sección I se presenta los principales enfoques y aproximaciones asintóticas para realizar inferencia respecto al índice de Gini. En la sección II se considera las diferentes metodologías bootstrap y se revisa los argumentos y críticas del uso de unas u otras técnicas. En la sección III se realiza una simulación que permite comparar los resultados de las diferentes técnicas a partir de muestras generadas por el modelo de Dagum de tipo I. En la sección IV se obtiene las estimaciones por intervalos y los contrastes para las muestras reales del caso español en el periodo 1993-2000. Finalmente, se resumen las conclusiones del trabajo.

I. Teoría asintótica del índice de Gini

Supongamos que la distribución de la variable renta (X) puede representarse por un elemento del conjunto de funciones continuas Φ:={f(x):ℜ+→[0,1]} en el que ℜ+:=(0,∞) y la función de densidad f(x) = dF(x)/dx. En este marco, el índice de Gini, I _G = Ψ(F(x)), se presenta, en la bibliografía de la desigualdad, con diferentes formulaciones que han permitido considerar distintas dimensiones e interpretaciones del grado de desigualdad que trata de medir.^¹

Por otra parte, dado que el índice de Gini se puede considerar, desde el enfoque inferencial, como un parámetro desconocido de la población objeto de estudio, es necesaria su estimación a partir de una muestra y, consecuentemente, el conocimiento de sus estimadores y de sus propiedades estadísticas. Así pues, en esta sección se trata las diferentes expresiones del parámetro índice de Gini, de sus estimadores y, posteriormente, de las distribuciones asintóticas de los mismos, centrándonos en las que se utilizarán en el presente artículo.

Entre estas formulaciones, y con el objetivo de sistematizar las expresiones de su varianza asintótica, pueden diferenciarse tres enfoques para la estimación del índice de Gini: un enfoque geométrico que lo relaciona con el área bajo la curva de Lorenz, un segundo enfoque basado en su formulación a partir de la covarianza entre la renta y su función de distribución y, finalmente, un enfoque centrado en su expresión a partir de la desviación absoluta media. Dentro de este último enfoque, que será el que aquí utilizamos, ^{Kendall y Stuart
(1969)} presentan el índice de Gini como una medida de dispersión relativa semejante al coeficiente de variación de Pearson:

IG=Δ2μ

en que Δ=∬|x−y|f(x)f(y)dxdy es la desviación absoluta media y μ, la renta media. El estimador directo de esta expresión basado en una muestra de la población con función de distribución F(x), según ^{Kendall y Stuart (1969), p. 48}, es:

I^G=12x¯n(n−1)∑i=1n∑j=1n|xi−xj|

en que x¯ es la media muestral.

Otro estimador del índice de Gini recogido también por ^{Kendall y Stuart (1969), p. 51}, es:

I^G=12x¯n(n−1)∑i=1n−1i(n−i)[x(i+1)−x(i)]

en el que x ₍₁₎ ≤ ... ≤ x_(n) son los correspondientes estadísticos ordenados de la muestra.

Esta formulación permite considerar el índice de Gini como una función de los estadísticos U y, por tanto, puede deducirse la distribución asintótica aprovechando los resultados de ^{Hoeffding
(1948)}. Así, n(I^G−IG) tendrá una distribución asintótica normal de media 0. El estimador de la varianza de esta distribución ha sido obtenido por diferentes autores. ^{Glasser (1962)} y ^{Gastwirth y Gail (1985)} proponen estimadores basados directamente en los resultados de ^{Hoeffding
(1948)}.^² ^{Cowell (1989)} proporciona un estimador de la varianza asintótica para el caso de datos con diferentes ponderaciones, particularmente útil cuando se tienen datos de rentas de hogares con ponderaciones debidas al diseño muestral y al tamaño del hogar, como es nuestro caso. Por tanto, la expresión de la varianza asintótica que se utilizará en este artículo se corresponde con la expresión de ^{Cowell (1989)}. Dicha expresión se utiliza para los datos de rentas personales no agrupadas obtenidas a partir del Phogue.

II. Técnicas bootstrap en medidas de desigualdad

El objetivo de las técnicas bootstrap es el de proporcionar una aproximación a la distribución de un estimador (I^G), en este caso del índice de Gini, mediante la extracción de B muestras de tamaño n con remplazamiento. Con cada muestra bootstrap se obtiene una estimación del índice de desigualdad que notamos por IG∗B(b=1, 2, ..., B). Consecuentemente, se dispondrá de B estimaciones, (IG∗1, IG∗2, ..., IG∗B), cuya distribución empírica, Fn(IG∗b) , que denominamos distribución bootstrap, se utiliza como aproximación a la distribución de I^G. Un ejemplo de la utilización de Fn(IG∗b) es la obtención de un estimador congruente del error estándar de I^G:

σ^(I^G)=B(B−1)∫(IG*b−I¯G*)2d(Fn(IG*b))

La obtención de intervalos de confianza puede realizar se mediante diferentes modalidades de la técnica bootstrap. Una de estas modalidades es el método del percentil, que consiste en calcular los extremos del intervalo de confianza a partir de los percentiles de la distribución bootstrap. Es decir, fija do un nivel de confianza al (1 − α)%, el límite inferior, L _inf , y superior, L _sup , se fijarían de tal manera que Fn(Linf∗)=α/2 y Fn(Lsup∗)=1−α/2 en la distribución bootstrap obtenida.

Una versión mejorada del método del percentil es la denomina da BCA (Bias corrected and accelerated), que introduce un mecanismo de corrección del error. Los extremos de los intervalos de confianza obtenidos con el método BCA también son percentiles de la distribución bootstrap, pero distintos de los utilizados en el método del percentil. Los nuevos percentiles dependen de dos números, α^ y z^0, denominados aceleración y corrección por sesgo, respectivamente.^³

El método del percentil-t o bootstrap-t consiste en construir los intervalos a partir del pivote asintótico:

I^G*−IGSd(I^G)

en que I^G∗ serán las reproducciones del estadístico de que se trate y Sd(I^G∗) su error estándar. Dicho error puede estimarse mediante la correspondiente varianza asintótica o por un procedimiento de bootstrap anidado en el que se añade un nuevo error de aproximación, como señalan, entre otros, ^{Andrés y
Calonge (2005)}. Ante este hecho se ha optado por la utilización de la varianza asintótica en los pivotes.

Para la comparación entre índices de Gini, cuando los intervalos de confianza se solapan (^{Gradín y del Río, 2001}; ^{Moran, 2006}), sería necesario realizar un contraste de hipótesis de diferencia de índices Gini, es decir, contrastar la hipótesis H ₀:I _G1 = I _G2 . Una manera de realizar el contraste, mediante el método percentil o el método BCA, consistiría en utilizar los cuantiles apropiados de la distribución bootstrap del estadístico d^=I^G1−I^G2 para fijar la región crítica o el p-valor. En el caso del método bootstrap-t, se partiría de un estadístico de contraste que fuera un pivote asintótico cuya distribución bootstrap serviría para realizar el contraste.

En las descripciones habituales de los métodos bootstrap se suele considerar que todas las observaciones tienen el mismo peso (1/n). Sin embargo, en una muestra de rentas de hogares cada observación recibe una ponderación igual al producto del número de miembros del hogar (n _h ) y del peso que se le asigna a cada hogar resultado del diseño muestral (whdiseño). Teniendo en cuenta estos aspectos, para realizar el estudio de sensibilidad de las estimaciones a las diferentes metodologías, proponemos un procedimiento de selección de los elementos de las muestras bootstrap de manera proporcional a la ponderación asignada a cada uno de ellos. Con este fin, se ha genera do inicialmente una muestra de rentas persona les, en la que a cada observación se le asigna una probabilidad de ser selecciona da igual a whdiseño/Σwhdiseño. Finalmente, se obtienen las B re producciones bootstrap a partir del diseño muestral anterior, respetando así la probabilidad de selección asignada a cada unidad. De esta manera, se corrigen las estimaciones de los efectos del diseño muestral y se proporcionan intervalos más precisos que los calculados por el método de ^{Biewen (2002)}.

Las ventajas de utilizar la metodología bootstrap frente a la teoría asintótica de los indicadores de desigualdad se refieren, principalmente, a su menor costo computacional y a que se evita la cuestionable utilización de la distribución normal como aproximación de la distribución de los estimadores. Además, algunos métodos bootstrap (percentil y BCA) evitan la posibilidad de que los intervalos excedan los límites que puede tomar la medida de que se trata. Dichas ventajas^⁴ se enfrentan a determinados inconvenientes, como la menor solidez de estos métodos ante la influencia de los valores extremos. Sin embargo, hay que señalar que, entre los diferentes indicadores de desigualdad, el índice de Gini es uno de los menos sensibles a la presencia de valores extremos (^{Cowell
y Flachaire, 2002}).

En cualquier caso, ^{David son y Duclos (2000)} señalan que las técnicas bootstrap permiten obtener mejores resultados si son aplicadas en pivotes asintóticos, por lo que conviene considerar también una metodología que combine técnicas bootstrap y las varianzas asintóticas como estimadores de la desviación característica utilizada en los pivotes.

Dentro de la metodología bootstrap, si bien parece que la técnica de pi votes asintóticos (bootstrap-t) presenta mejores propiedades,^⁵ ^{Moran (2006)} y ^{Gray, Mills y Zandvakili (2003)} señalan que el método del percentil presenta menor costo computacional que los métodos BCA y bootstrap-t y, a diferencia de este último, produce intervalos que no se extenderán más allá de las cotas posibles del índice. Finalmente, hay que señalar que los resultados obtenidos en estudios de simulación realizados por distintos autores (^{Cowell y Flachaire,
2002}; ^{Moran, 2006}; ^{Gastwirth, Modarres y Bura, 2005}) muestran coberturas y probabilidades de rechazo muy semejantes entre los distintos métodos bootstrap para muestras grandes, como las aquí utilizadas. Consecuentemente, tal y como señala ^{Trede
(2002)}, en ocasiones, determinados refinamientos de los métodos bootstrap no producen grandes mejoras de resultados.

Así pues, la abundancia de argumentos en favor y en contra de las distintas metodologías y la consiguiente ausencia de un consenso en la utilización de una metodología única hace necesarios estudios de sensibilidad que permitan conocer la influencia de las diferentes técnicas inferenciales en los resultados. Para el caso español, son escasos los estudios que comparan los resultados de la utilización de diferentes técnicas inferenciales en el análisis de evolución de la desigualdad. En los años recientes, encontramos los trabajos de ^{Andrés y Calonge (2005)} que analizan la repercusión de varias técnicas bootstraps en las conclusiones extraídas a partir una muestra matching de rentas de ingresos antes y después de impuestos. ^{Gradín y Del Río (2001)} presentan los resultados de los contrastes de comparación entre estimaciones sucesivas del índice de Gini aplicando, únicamente, la metodología bootstrap.

III. Un estudio de simulación a partir de la distribución de Dagum de tipo I

El objetivo de este estudio de simulación es compararlos resultados de los distintos tipos de inferencia del índice de Gini, utilizando muestras extraídas de una población regida por una distribución de (Dagum de tipo I ^{Dagum, 1977}). Dicha distribución se ajusta de manera adecuada a la distribución personal de la renta en España (^{García, Ca lleal ta y Núñez, 2006}; ^{Prieto, 1998}; ^{Pena et
al, 1996}) y también a las distribuciones de renta de numerosos países (^{Dastrup, Hartshorn y McDonald,
2007}), entre ellos algunos latinoamericanos como México y Argentina (^{Gertel et al, 2001}). Por tanto, los resultados de la simulación podrían generalizarse a un buen número de casos.

Las funciones de densidad y distribución del modelo de Dagum de tipo I, que se han utilizado para la generación de muestras, son las siguientes:

f(x)=λβδx−δ−1(1−λx−δ)−β−1; 0<;x<;∞; λ>0,δ>0,β>0F(x)=(1+λx−δ)−β; 0<;x<;∞; λ>0,δ>0,β>0

Para obtener las muestras, se han tomado valores de los parámetros λ, β y, σ cercanos a los estimados para la distribución de la renta en España, lo que produce un índice de Gini igual a 1/3, que será la referencia como valor del parámetro poblacional. Para realizar el experimento se han generado mil muestras de tamaños 100, 500, 1 000 y 5 000, con el objetivo de analizar el grado de cobertura y la longitud de los intervalos de confianza mediante la teoría asintótica y los métodos bootstrap del percentil, BCA y boos trap-t.

En el cuadro 1 se presenta el grado de cobertura (proporción de intervalos de confianza que contenían el verdadero valor del parámetro) y la longitud media de los intervalos de confianza, con una cobertura nominal de 95%. Los resultados de dicho cuadro permiten concluir, en primer lugar, que la cobertura del método bootstrap-t con muestras pequeñas es mayor que la del resto de los métodos, como también señalan ^{Giorgi, Palmitesta y Provasi (2005)}. Sin embargo, cuando el tamaño muestral es 1 000 y 5 000, las diferencias en la cobertura son insignificantes. En cuanto a la longitud, se observa que los intervalos más precisos son los proporcionados por el método del percentil para cualquier tamaño muestral.

Cuadro 1 Cobertura y longitudes medias de los intervalos obtenidos para el índice de Gini. 1 000 reproducciones; n = 100, 500, 1 000 y 5 000

n	Teoría asintótica		Método del percentil		BCA		Bootstrap-t
n	Cobertura	Longitud	Cobertura	Longitud	Cobertura	Longitud	Cobertura	Longitud
100	0.8688	0.1148	0.8682	0.1156	0.8942	0.1210	0.9230	0.1620
500	0.9204	0.0603	0.9071	0.0596	0.9170	0.0625	0.9140	0.0716
1 000	0.9315	0.0449	0.9300	0.0448	0.9180	0.0468	0.9300	0.0487
5 000	0.9358	0.0371	0.9430	0.0206	0.9450	0.0211	0.9460	0.0237

Los resultados confirman, por tanto, la similitud de cobertura de todos los métodos en el caso de muestras grandes (como las que por lo común se dispone en las encuestas de hogares). En cuanto a las longitudes de los intervalos, éstas son inferiores en los casos del percentil y el boostrap-t, lo que puede implicar, para estos dos métodos, una mayor facilidad en la detección de diferencias significativas cuando se comparan dos estimaciones del índice de Gini. El método BCA no registra siempre una mejora en la cobertura respecto al percentil, excepto con las muestras más pequeñas. Para muestras grandes ambos métodos producen resultados similares, aunque las longitudes de los intervalos son escasamente inferiores en el caso del percentil.

Los métodos bootstrap-t y asintótico, aunque presentan coberturas mayores para muestras pequeñas, producen resultados similares a los otros dos métodos en el caso de muestras grandes. Esta circunstancia indica la conveniencia de la elección de los métodos bootstrap más sencillos y, entre ellos, el método del percentil, dado que, para muestras grandes, los resultados son semejantes a los de otros métodos más elaborados, que traerían consigo un gran costo computacional ante observaciones ponderadas y un tamaño muestral grande.

Hay que señalar finalmente que la forma paramétrica selecciona da (Dagum de tipo I) tiene una influencia decisiva en los resultados de la simulación; por tanto, los resultados que aquí se presentan son válidos para este caso concreto, en el que se ha escogido una función de densidad adecuada, entre otros, al caso español que se analizará en la sección siguiente.

IV. Análisis de sensibilidad de las técnicas de inferencia para los resultados del caso español (1993-2000)

Para comprobar si cambian significativamente las conclusiones respecto a la dinámica de la desigualdad en el caso español, hemos realizado contrastes y calculado los intervalos de confianza del índice de Gini durante el periodo 1993-2000, utilizando la teoría asintótica y los distintos métodos bootstraps.

Para analizar las distribuciones de renta de España en el periodo 1993-2000, se han utilizado todas las muestras de corte transversal^⁶ procedentes del Phogue. El concepto de renta utilizado es el de renta disponible por hogar, tras sumar transferencias y deducir los impuestos y contribuciones a la seguridad social. La unidad de análisis es la persona. Por tanto, cada hogar recibe una ponderación proporcional al número de sus miembros y al peso que le asigna el diseño muestral. La escala de equivalencia utilizada es la de la OCDE modificada, que asigna el valor 1 al primer adulto en el hogar, cada adulto adicional recibe una ponderación de 0.5 y cada niño menor de 16 años una ponderación de 0.3.^⁷ Los tamaños muestrales utilizados para el periodo 1993-2000 oscilan entre 7 142 para 1993 y 4 950 para 2000, lo que nos sitúa inicialmente en la línea de las conclusiones obtenidas para muestras grandes en la simulación realizada en la sección anterior.

En el cuadro 2 se presenta los resultados de los intervalos de confianza para el índice de Gini según los diferentes métodos de inferencia. En general, los intervalos muestran una gran similitud, aunque se observa una mayor aproximación entre los resultados obtenidos mediante varianzas asintóticas y la metodología bootstrap-t, así como entre los intervalos de los métodos percentil y BCA. Estos dos últimos métodos proporcionan siempre intervalos más estrechos, tal como ocurría en la simulación cuando las muestras eran más grandes.

Cuadro 2 Intervalos de confianza obtenidos con los diferentes métodos de inferencia

n	Varianza asintótica		Bootstrap percentil		BCA		Bootstrap-t
n	LI	LS	LI	LS	LI	LS	LI	LS
1993	0.3387	0.3471	0.3391	0.3467	0.3389	0.3465	0.3389	0.3473
1994	0.3329	0.3411	0.3336	0.3405	0.3336	0.3405	0.3332	0.3411
1995	0.3359	0.3474	0.3372	0.3461	0.3369	0.3460	0.3362	0.3470
1996	0.3459	0.3554	0.3466	0.3543	0.3465	0.3542	0.3459	0.3553
1997	0.3332	0.3432	0.3342	0.3418	0.3345	0.3422	0.3332	0.3439
1998	0.3249	0.3370	0.3269	0.3350	0.3268	0.3349	0.3249	0.3368
1999	0.3181	0.3295	0.3191	0.3292	0.3187	0.3285	0.3185	0.3294
2000	0.3195	0.3350	0.3220	0.3323	0.3220	0.3323	0.3201	0.3360

Los casos extremos de variabilidad en los límites superior e inferior se ilustran en la gráfica 1, en la que se representa los intervalos obtenidos en el año en el que son más parecidos (1993) y en el año en el que se aprecia mayores diferencias (2000). En es te último año la muestra sufre una importante reducción, lo que aumenta las longitudes de los intervalos y, por tanto, la posibilidad de que existan mayores diferencias entre métodos.

Gráfica 1 Intervalos de confianza para el índice de Gini

La utilización de las varianzas asintóticas para construir los pivotes de la metodología bootstrap-t puede explicar la similitud de los resultados que producen las dos metodologías. Por otra parte, la semejanza de los resultados del método percentil y BCA se explica, obviamente, por que este último no deja de ser una versión mejorada primero.

Si comparamos los extremos entre los métodos que producen resultados más dispares (asintótico-percentil, BCA-bootstrap-t, asintótico-BCA, percentil-bootstrap-t), las diferencias entre los límites de los intervalos están habitualmente en el tercer o cuarto decimal; esto supone que la mayor parte de dichas diferencias no llega a 1%. Si comparamos los resultados más próximos (asintótico-bootstrap-t y percentil-BCA), se producen algunas coincidencias completas de los extremos de los intervalos en los cuatro primeros decimales, siendo la diferencia máxima entre límites inferior a 0.3 por ciento.

Los resultados de los contrastes respecto a los índices de Gini de años consecutivos según los cuatro métodos de inferencia se presentan en el cuadro 3. Es importante señalar que, una vez realizados los contrastes, se observa claramente la necesidad de utilizar la inferencia estadística para comparar índices de Gini. En este sentido, si consideramos, por ejemplo, el repunte de la desigualdad indicado por el incremento del estimador puntual del índice de Gini en 2000, el contraste de hipótesis realizado revela ahora un cambio de la desigualdad irrelevante, carente de significación estadística.

Cuadro 3 Resultados de los contrastes de significación realizados entre años consecutivos. (Significación a 5 y 10 por ciento)

		Varianza asintótica	Bootstrap-t	Percentil	BCA
Incrementos/disminuciones significativos a 10% de significación
	1993-1994	−	−	−	−
	1994-1995	=	+	+	+
	1995-1996	+	+	+	+
	1996-1997	−	−	−	−
	1997-1998	−	−	−	−
	1998-1999	−	−	−	−
	1999-2000	=	=	=	=
Incrementos/disminuciones significativos a 5% de significación
	1993-1994	=	−	−	−
	1994-1995	=	=	=	=
	1995-1996	+	+	+	+
	1996-1997	−	−	−	−
	1997-1998	=	−	−	−
	1998-1999	=	−	−	−
	1999-2000	=	=	=	=

Los resultados del cuadro 3 son idénticos para los métodos bootstrap-t, percentil y BCA, a los niveles del 5 y 10% de significación. Por tanto, la evolución de la desigualdad que se deduce de los tres métodos de inferencia es la misma. En el caso del método asintótico se observa una mayor presencia de igualdades, es decir, ausencia de variaciones significativas entre años consecutivos, en particular cuando se utiliza una significación del 5%. Si se aumenta la significación al 10%, las diferencias entre los resultados de contrastes de los cuatro métodos se reducen a la comparación de los índices de Gini de 1994 y 1995, en que la utilización del método de varianzas asintóticas nos lleva a descartar una variación significativa del índice, frente a los otros tres métodos que detectan un incremento significativo del indicador.

Por tanto, en líneas generales, las diferentes técnicas estadísticas con fluyen en establecer las siguientes fases de evolución de la desigualdad en España a partir del índice de Gini: una fa se de predominio de incrementos has ta 1996, una fase de descenso de la desigualdad hasta 1999 y una moderación de esta tendencia en 2000.^⁸

Conclusiones

La utilización de técnicas de inferencia estadística en las estimaciones puntuales de los indicadores de desigualdad resulta indispensable por la presencia de errores muestrales que pueden alterar las conclusiones de la evolución del fenómeno. Así pues, en el estudio aquí realizado de la evolución del índice de Gini se comprueba que algunos incrementos y disminuciones de dicho estimador puntual se corresponden con variaciones que no resultan significativas, como demuestran los resultados de igualdad en los contrastes de hipótesis presenta dos en el cuadro 3. En es tos casos, la interpretación exclusiva de los incrementos o disminuciones de las estimaciones puntuales puede llevarnos a obtener conclusiones erróneas de la evolución de la desigualdad en los periodos de comparación.

La ausencia de consenso, en la bibliografía económica y estadística, en la utilización de una única técnica inferencial hace necesaria la realización de un análisis de sensibilidad que contribuya a determinar la influencia de la técnica en los resultados. En el presente trabajo es te análisis de sensibilidad se realiza, en una primera etapa, mediante un experimento de simulación utilizando la distribución de Dagum de tipo I. De dicho experimento se concluye una gran similitud de los resultados de los distintos métodos en el caso de muestras grandes, como las habitualmente utiliza das en estudios de desigualdad. Para es te tipo de muestras, los métodos bootstrap puros (percentil y BCA) originan intervalos más precisos que los obtenidos mediante la aproximación asintótica y el método bootstrap-t, aunque los niveles de cobertura son similares y próximos al nivel nominal. En el caso de muestras pequeñas, los métodos asintóticos y boostrap-t resultan más adecuados.

Los resultados del análisis aplicado al caso español, a partir de las muestras reales del Phogue (1993-2000), son similares a los obtenidos en el estudio de simulación pre vio para el caso de muestras grandes, obteniéndose intervalos de confianza muy similares para los distintos tipos de inferencia. En cualquier caso, hay que advertir que los métodos BCA y percentil, de menor costo computacional, son más precisos que los restantes.

Finalmente, teniendo en cuenta los resultados de los contrastes de hipótesis para las comparaciones interanuales de los índices de Gini, se concluye una pauta evolutiva similar para todas las metodologías de inferencia. La técnica asintótica presenta algunas particularidades debidas únicamente a la presencia de menos diferencias significativas en los resultados de los contrastes realizados con dicho método. Así pues, aunque la utilización de técnicas inferenciales es primordial para la obtención de conclusiones de la evolución del índice de Gini en España, la técnica de inferencia utilizada no es una elección que condicione en exceso los resultados obtenidos cuando se trabaja con muestras grandes. Gracias a esta similitud de resultados puede afirmarse que, en el periodo 1993-2000, el índice de Gini experimenta en España una fase de predominio de incrementos hasta 1996, una fase de descenso de la desigualdad hasta 1999 y una moderación de esta tendencia en 2000.

Referencias bibliográficas

Andrés, R., y S. Calonge (2005), “Inference on Income Inequality and Tax Progressivity Indices: U-Statistics and Bootstrap Methods”, Working Paper, 09/2005, ECINEQ, Society for the Study of Economic Inequality. [ Links ]

Beach, C. M., y R. Davidson (1983), “Distribution-Free Statistical Inference with Lorenz Curves and Income Shares”, The Review of Economic Studies, 50, páginas 723-735. [ Links ]

Biewen, M. (2002), “Bootstrap Inference for Inequality, Mobility and Poverty Measurement”, Journal of Econometrics, 108, pp. 317-342. [ Links ]

Bishop, J. A, S. Chakraborti, y P.D. Thistle (1990), “An Asymptotically Distribution-Free Test for Sen’s Welfare Index”, Oxford Bulletin of Economics & Statistics, 52, pp. 105-113. [ Links ]

Buhmann, B., G. Rainwater, G. Schmaus, y T. Smeeding (1988), “Equivalent Scales, Well Being, Inequality and Poverty: Sensivity Estimates Across ten Countries Using the Luxembourg Income Study Database”, Review of Income and Wealth, 34, pp. 115-142. [ Links ]

Coulter, F., F. Cowell, y S. Jenkins (1992), “Differences in Needs and Assessment of Income Distributions”, Bulletin of Economic Research, 44, pp. 77-124. [ Links ]

Cowell, F. A. (1989), “Sampling Variance and Decomposable Inequality Measures”, Journal of Econometrics, 42, pp. 27-41. [ Links ]

______, y E., Flachaire (2002), “Sensitivity of Inequality Measures to Extreme Values”, Working Paper, STICERD-Distributional Analysis Research Programme Papers 60, Suntory and Toyota International Centres for Economics and Related Disciplines, LSE. [ Links ]

Dagum, C. (1977), “A New Model of Personal Income Distribution: Specification and Estimation”, Economie Appliquée, 30(3), pp. 413-436. [ Links ]

Dastrup, S., R. Hartshorn, y J. McDonald (2007), “The Impact of Taxes and Transfer Payments on the Distribution of Income: A Parametric Comparison”, Journal of Economic Inequality, pp. 1569-1721. [ Links ]

Davidson, R., y J.Y. Duclos (2000), “Statistical Inference for Stochastic Dominance and for the Measurement of Poverty and Inequality”, Econometrica, 68, pp. 1435-1465. [ Links ]

______, y E., Flachaire (2004), “Asymptotic and Bootstrap Inference for Inequality and Poverty Measures”, Cahiers de la Maison des Sciences Economiques, vol. 04100, Universidad de Paris Panthéon-Sorbonne. [ Links ]

Duclos, J. Y., y M. Mercarder-Prats (1999), “Household Needs and Poverty with Application to Spain and the UK”, Review of Income and Wealth, 45(1), pp. 77-98. [ Links ]

Efron, B., y R. Tibshirani (1993), An Introduction to the Bootstrap, Londres, Chapman and Hall. [ Links ]

García, C. (2006), La distribución personal de la renta en España. Aplicaciones de la modelización paramétrica, Alcalá de Henares, Servicio de Publicaciones de la Universidad de Alcalá. [ Links ]

______, F. J., Callealta, y J. J., Núñez (2006), “La evolución de la distribución personal de la renta en España (1973-2001). Con parámetros del modelo de Dagum”, EL TRIMESTRE ECONÓMICO, vol. LXXIII (4), núm. 292, pp. 783-808. [ Links ]

Gastwirth, J. L., y M. H. Gail (1985), “Simple Asymptotically Distribution-Free Methods for Comparing Lorenz Curves and Gini Indices Obtained from Complete Data”, Advances in Econometrics, vol. 4, pp. 229-243. [ Links ]

______, R., Modarres, y E., Bura (2005), “The Use of the Lorenz Curve, Gini Index and Related Measures of Relative Inequality and Uniformity in Securities Law”, Metron-International Journal of Statistics, LXIII, 3, pp. 451-469. [ Links ]

Gertel, H. R., R. Giudliodori, P. F. Auerbach, y A. Rodríguez (2001), “Evaluating Equality Using Parametric Income Distribution Models. An Exploration of Alternative Effects Using a Dagun Parametric Income Distribution Model”, II Segunda Reunión Internacional Sobre Dinámica de Sistemas Socioeconómicos, Instituto Latinoamericano de Integración, UNL, La Plata, Argentina. [ Links ]

Giles, D. E. A. (2004), “Calculating a Standard Error for the Gini Coefficient: Some Further Results”, Oxford Bulletin of Economics and Statistics, 66, páginas 425-433. [ Links ]

Giorgi, G. M., P. Palmitesta, y C. Provasi (2005), “Asymptotic and Bootstrap Inference for the Generalized Gini Indices”, The C. Gini and M. O. Lorenz International Conference, Siena. [ Links ]

Glasser, G. J. (1962), “Variance Formulas for the Mean Difference and Coefficient of Concentration”, Journal of the American Statistical Association, 57, núm. 299, pp. 648-654. [ Links ]

Gradín, C., y C. del Río (2001), Desigualdad, pobreza y polarización en la distribución de la renta en Galicia, La Coruña, Instituto de Estudios Económicos de Galicia Pedro Barrié de la Maza. [ Links ]

Gray, D., J. A. Mills, y S. Zandvakili (2003), “New Perspectives on Canadian National and Regional Income Inequality”, University of Cincinnati, Economics Working Papers Series 2003-03. [ Links ]

Hall, P. (1992), The Bootstrap and Edgeworth Expansion, Nueva York, primavera. [ Links ]

Hoeffding, W. (1948), “A Class of Statistics with Asymptotically Normal Distribution”, The Annals of Mathematical Statistics, 19, pp. 293-325. [ Links ]

Kendall, M. G., y A. Stuart (1969), The Advanced Theory of Statistics, vol. 1, Londres, Charles Griffin. [ Links ]

Lerman, R. I., y S. Yitzhaki (1984), “A Note on the Calculation and Interpretation of the Gini Index”, Economics Letters, 15, pp. 363-368. [ Links ]

Maasoumi, E. (1997), “Empirical Analysis of Inequality and Welfare”, M. H. Pesaran y P. Schmidt (comps.), Handbook of Applied Econometrics. Microeconomics, Blackwell. [ Links ]

Mills, J., y S. Zandvakili (1997), “Statistical Inference via Bootstrapping for Measures of Inequality”, Journal of Applied Econometrics, 12, pp. 133-150. [ Links ]

Modarres, R., y J. L. Gastwirth. (2006), “A Cautionary Note on Estimating the Standard Error of the Gini Index of Inequality”, Oxford Bulletin of Economics and Statistics, 68, pp. 385-390. [ Links ]

Moran, T. P. (2006), “Statistical Inference and Patterns of Inequality in the Global North”, Social Forces, 84 (3), pp. 1799-1818. [ Links ]

Ogwang, T. (2000), “A Convenient Method of Computing the Gini Index and its Standard Error”, Oxford Bulletin of Economics and Statistics, 62, pp. 123-129. [ Links ]

Pena, J. B., J. Callealta, J. M. Casas, A. Merediz, y J. J. Núñez (1996), Distribución personal de la renta en España, Madrid, Pirámide. [ Links ]

Prieto, M. (1998), “Modelización Paramétrica de la Distribución Personal de la Renta para España mediante Métodos Robustos”, tesis doctoral, Facultad de Ciencias Económicas y Empresariales, Universidad de Valladolid. [ Links ]

Sandström, A., J. H. Wretman, y B. Waldén (1985), “Variance Estimators of the Gini Coefficient, Simple Random Sampling”, Metron, 43, pp. 41-70. [ Links ]

______, ______ y ______ (1988), “Variance Estimators of the Gini Coefficient-Probability Sampling”, Journal of Business and Economic Statistics, 6(1), pp. 113-119. [ Links ]

Trede, M. (2002), “Bootstrapping Inequality Measures under the Null Hypothesis: Is it Worth the Effort?”, Journal of Economics, 9, pp. 261-281. [ Links ]

Xu, K. (2003), “How Has the Literature on Gini’s Index Evolved in the Past 80 Years?”, Working Paper of Department of Economics, Dalhousie University. [ Links ]

Yitzhaki, S. (1991), “Calculating Jackknife Variance Estimators for Parameters of the Gini Method”, Journal of Business and Economic Statistics, 9(2), pp. 235-39. [ Links ]

______ (1998), “More Than a Dozen Alternative Ways of Spelling Gini”, Research on Economic Inequality, 8, pp. 13-30. [ Links ]

¹ ^{Yitzhaki (1998)} y ^{Xu (2003)} revisan las expresiones más utilizadas del índice de Gini.

² ^{Sandström, Wretman y Waldén (1985}, ¹⁹⁸⁸⁾ aproximan la varianza asintótica a la varianza jack knife del índice de Gini.

³Véase una descripción del método en ^{Efron y
Tibshirani (1993), cap. 14}.

⁴Las ventajas de la utilización de la metodología bootstrap se detallan en los trabajos de ^{Davidson y Flachaire
(2004)}, ^{Biewen (2002)} y ^{Mills y Zandvakili (1997)}, entre otros.

⁵Los errores en la cobertura de los intervalos (o en la probabilidad de rechazar la hipótesis nula, en los contrastes de hipótesis) son menores que con el método del percentil ^{(Hall, 1992)}.

⁶De esta manera se elimina la dependencia entre unidades que se introduciría si se estudiaran las muestras panel o longitudinales.

⁷Dado que, como lo señalan ^{Coulter, Cowell y
Jenkins (1992)}, no existe una escala de equivalencia que sea superior a las demás, se han realizado también los cálculos con otras tres escalas de equivalencia: la per capita, la escala de la OCDE y la raíz cuadrada del tamaño del hogar. Los resultados obtenidos con estas tres escalas, en lo que se refiere a la comparación de técnicas de inferencia, no varían considerablemente de los que se presenta en este artículo utilizando la escala de la OCDE modificada.

⁸Esta es también la conclusión a la que se llega utilizando las otras tres escalas de equivalencia mencionadas: per capita, OCDE y raíz cuadrada del tamaño del hogar.

Recibido: 04 de Junio de 2007; Aprobado: 01 de Octubre de 2007

^* Autor para correspondencia: e-mail: carmelo.garcia@uah.es; prietoal@caee.uva.es

Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons