Clasificación JEL: C15, D31, I32.
Introducción
Las conclusiones respecto a la evolución de la desigualdad se deducen, en ocasiones, de la mera variación de las estimaciones puntuales de indicadores, sin considerar que dichas estimaciones están sujetas a errores muestrales que determinan la significación estadística de los cambios interanuales. Así pues, un aumento del índice de Gini suele ser considerado como una señal inequívoca del aumento de la desigualdad de un país, sin introducir los elementos de cautela necesarios, inherentes a la interpretación de estimaciones procedentes de muestras.
Los aspectos inferenciales de los indicadores de desigualdad no eran tradicionalmente un objetivo prioritario de los investigadores, puesto que, al trabajar con muestras grandes, se consideraba que los errores estándar eran tan pequeños que no alteraban la precisión de las estimaciones y, por ende, las conclusiones obtenidas. Sin embargo, algunos autores, entre ellos Maasoumi (1997), destacan que los errores estándar pueden ser grandes, lo que puede cuestionar la validez de las afirmaciones realizadas. Por tanto, las conclusiones respecto a los incrementos en las estimaciones de un indicador deben basarse en contrastes de hipótesis que introduzcan la idea de significación estadística de los cambios experimentados.
Llegados al convencimiento de la necesidad de la inferencia, es importante abordar la correcta selección de las técnicas más apropiadas. Una manera de tratar la inferencia estadística en medidas de desigualdad se centra en el uso de la teoría asintótica (Cowell, 1989 y Davidson y Duclos, 2000). Otro enfoque consiste en aplicar técnicas bootstrap (Mills y Zandvakili, 1997, y Biewen, 2002) para obtener intervalos de confianza o realizar contrastes de hipótesis.
Los argumentos en favor o en contra del uso de la teoría asintótica o de la metodología bootstrap se mencionan en numerosos trabajos, en los que se destacan sus ventajas e inconvenientes, sin deducirse una clara superioridad de una única metodología. Por tanto, resulta primordial realizar un análisis de sensibilidad que permita comprobar si las conclusiones de los estudios quedan sujetas al tipo de inferencia realizado. El análisis de sensibilidad que se propone en este trabajo consta de dos etapas: un estudio de simulación previo a la estimación y un estudio final de las estimaciones obtenidas con los datos muestrales del caso español.
El estudio pre vio de simulación consiste en la comparación de los resultados obtenidos mediante las diferentes técnicas, a partir de muestras generadas por un modelo paramétrico de la distribución personal de la renta. Este tipo de simulaciones, al conocer se los valores de los parámetros poblacionales, permite valorar el acierto de los intervalos de confianza o los contrastes de hipótesis.
La fidelidad de la forma funcional simuladora al caso particular de estudio es un aspecto importante, dado que la función específica, adoptada como modelo de la distribución, determina los resultados obtenidos para las diferentes estimaciones. Este elemento resulta determinante en aspectos tales como la sensibilidad de los indicadores de desigualdad a los valores extremos (Davidson y Duclos, 2000), hecho que requiere una correcta modelización de las colas.
El análisis de sensibilidad a posteriori con los datos reales de un caso supone utilizar diferentes técnicas de inferencia que generarán un conjunto de estimaciones por intervalos o un conjunto de resultados de los contrastes de hipótesis. Con este tipo de análisis podrán obtenerse conclusiones comparativas entre los diferentes resultados, aunque no puede calibrarse el acierto de las afirmaciones realizadas, por el obvio desconocimiento de los valores de los parámetros poblacionales.
Este esquema doble de análisis se aplica, en este trabajo, a la evolución del índice de Gini en España, según los datos del Panel de Hogares de la Unión Europea (Phogue), en el periodo 1993-2000. Así pues, se realizará, en primer lugar, un estudio de simulación, con el que se pretende estudiar el funcionamiento de las diferentes técnicas con muestras extraídas de una población que sigue un modelo Dagum de tipo I, modelo que, según numerosos trabajos (García, 2006; García, Callealta y Núñez, 2006; Prieto, 1998; Pena et al, 1996), proporciona el mejor ajuste a la distribución empírica del caso español. En segundo lugar, se realizará un estudio empírico de la repercusión de las diferentes técnicas de inferencia (bootstrap y asintóticas) en los intervalos de confianza y los contrastes de hipótesis realizados para comparar índices de Gini, utilizando las muestras reales del caso español.
La estructura del artículo es la siguiente. En la sección I se presenta los principales enfoques y aproximaciones asintóticas para realizar inferencia respecto al índice de Gini. En la sección II se considera las diferentes metodologías bootstrap y se revisa los argumentos y críticas del uso de unas u otras técnicas. En la sección III se realiza una simulación que permite comparar los resultados de las diferentes técnicas a partir de muestras generadas por el modelo de Dagum de tipo I. En la sección IV se obtiene las estimaciones por intervalos y los contrastes para las muestras reales del caso español en el periodo 1993-2000. Finalmente, se resumen las conclusiones del trabajo.
I. Teoría asintótica del índice de Gini
Supongamos que la distribución de la variable renta (X) puede
representarse por un elemento del conjunto de funciones continuas
Por otra parte, dado que el índice de Gini se puede considerar, desde el enfoque inferencial, como un parámetro desconocido de la población objeto de estudio, es necesaria su estimación a partir de una muestra y, consecuentemente, el conocimiento de sus estimadores y de sus propiedades estadísticas. Así pues, en esta sección se trata las diferentes expresiones del parámetro índice de Gini, de sus estimadores y, posteriormente, de las distribuciones asintóticas de los mismos, centrándonos en las que se utilizarán en el presente artículo.
Entre estas formulaciones, y con el objetivo de sistematizar las expresiones de su varianza asintótica, pueden diferenciarse tres enfoques para la estimación del índice de Gini: un enfoque geométrico que lo relaciona con el área bajo la curva de Lorenz, un segundo enfoque basado en su formulación a partir de la covarianza entre la renta y su función de distribución y, finalmente, un enfoque centrado en su expresión a partir de la desviación absoluta media. Dentro de este último enfoque, que será el que aquí utilizamos, Kendall y Stuart (1969) presentan el índice de Gini como una medida de dispersión relativa semejante al coeficiente de variación de Pearson:
en que
en que
Otro estimador del índice de Gini recogido también por Kendall y Stuart (1969), p. 51, es:
en el que x (1) ≤ ... ≤ x (n) son los correspondientes estadísticos ordenados de la muestra.
Esta formulación permite considerar el índice de Gini como una función de los
estadísticos U y, por tanto, puede deducirse la distribución
asintótica aprovechando los resultados de Hoeffding
(1948). Así,
II. Técnicas bootstrap en medidas de desigualdad
El objetivo de las técnicas bootstrap es el de proporcionar una
aproximación a la distribución de un estimador (
La obtención de intervalos de confianza puede realizar se mediante diferentes
modalidades de la técnica bootstrap. Una de estas modalidades es el
método del percentil, que consiste en calcular los extremos del intervalo de
confianza a partir de los percentiles de la distribución bootstrap.
Es decir, fija do un nivel de confianza al (1 − α)%, el límite inferior,
L
inf
, y superior, L
sup
, se fijarían de tal manera que
Una versión mejorada del método del percentil es la denomina da BCA (Bias
corrected and accelerated), que introduce un mecanismo de corrección
del error. Los extremos de los intervalos de confianza obtenidos con el método BCA
también son percentiles de la distribución bootstrap, pero
distintos de los utilizados en el método del percentil. Los nuevos percentiles
dependen de dos números,
El método del percentil-t o bootstrap-t consiste en construir los intervalos a partir del pivote asintótico:
en que
Para la comparación entre índices de Gini, cuando los intervalos de confianza se
solapan (Gradín y del Río, 2001; Moran, 2006), sería necesario realizar un
contraste de hipótesis de diferencia de índices Gini, es decir, contrastar la
hipótesis H
0:I
G1
= I
G2
. Una manera de realizar el contraste, mediante el método percentil o el
método BCA, consistiría en utilizar los cuantiles apropiados de la distribución
bootstrap del estadístico
En las descripciones habituales de los métodos bootstrap se suele
considerar que todas las observaciones tienen el mismo peso (1/n). Sin embargo, en
una muestra de rentas de hogares cada observación recibe una ponderación igual al
producto del número de miembros del hogar (n
h
) y del peso que se le asigna a cada hogar resultado del diseño muestral
Las ventajas de utilizar la metodología bootstrap frente a la teoría asintótica de los indicadores de desigualdad se refieren, principalmente, a su menor costo computacional y a que se evita la cuestionable utilización de la distribución normal como aproximación de la distribución de los estimadores. Además, algunos métodos bootstrap (percentil y BCA) evitan la posibilidad de que los intervalos excedan los límites que puede tomar la medida de que se trata. Dichas ventajas4 se enfrentan a determinados inconvenientes, como la menor solidez de estos métodos ante la influencia de los valores extremos. Sin embargo, hay que señalar que, entre los diferentes indicadores de desigualdad, el índice de Gini es uno de los menos sensibles a la presencia de valores extremos (Cowell y Flachaire, 2002).
En cualquier caso, David son y Duclos (2000) señalan que las técnicas bootstrap permiten obtener mejores resultados si son aplicadas en pivotes asintóticos, por lo que conviene considerar también una metodología que combine técnicas bootstrap y las varianzas asintóticas como estimadores de la desviación característica utilizada en los pivotes.
Dentro de la metodología bootstrap, si bien parece que la técnica de pi votes asintóticos (bootstrap-t) presenta mejores propiedades,5 Moran (2006) y Gray, Mills y Zandvakili (2003) señalan que el método del percentil presenta menor costo computacional que los métodos BCA y bootstrap-t y, a diferencia de este último, produce intervalos que no se extenderán más allá de las cotas posibles del índice. Finalmente, hay que señalar que los resultados obtenidos en estudios de simulación realizados por distintos autores (Cowell y Flachaire, 2002; Moran, 2006; Gastwirth, Modarres y Bura, 2005) muestran coberturas y probabilidades de rechazo muy semejantes entre los distintos métodos bootstrap para muestras grandes, como las aquí utilizadas. Consecuentemente, tal y como señala Trede (2002), en ocasiones, determinados refinamientos de los métodos bootstrap no producen grandes mejoras de resultados.
Así pues, la abundancia de argumentos en favor y en contra de las distintas metodologías y la consiguiente ausencia de un consenso en la utilización de una metodología única hace necesarios estudios de sensibilidad que permitan conocer la influencia de las diferentes técnicas inferenciales en los resultados. Para el caso español, son escasos los estudios que comparan los resultados de la utilización de diferentes técnicas inferenciales en el análisis de evolución de la desigualdad. En los años recientes, encontramos los trabajos de Andrés y Calonge (2005) que analizan la repercusión de varias técnicas bootstraps en las conclusiones extraídas a partir una muestra matching de rentas de ingresos antes y después de impuestos. Gradín y Del Río (2001) presentan los resultados de los contrastes de comparación entre estimaciones sucesivas del índice de Gini aplicando, únicamente, la metodología bootstrap.
III. Un estudio de simulación a partir de la distribución de Dagum de tipo I
El objetivo de este estudio de simulación es compararlos resultados de los distintos tipos de inferencia del índice de Gini, utilizando muestras extraídas de una población regida por una distribución de (Dagum de tipo I Dagum, 1977). Dicha distribución se ajusta de manera adecuada a la distribución personal de la renta en España (García, Ca lleal ta y Núñez, 2006; Prieto, 1998; Pena et al, 1996) y también a las distribuciones de renta de numerosos países (Dastrup, Hartshorn y McDonald, 2007), entre ellos algunos latinoamericanos como México y Argentina (Gertel et al, 2001). Por tanto, los resultados de la simulación podrían generalizarse a un buen número de casos.
Las funciones de densidad y distribución del modelo de Dagum de tipo I, que se han utilizado para la generación de muestras, son las siguientes:
Para obtener las muestras, se han tomado valores de los parámetros λ, β y, σ cercanos a los estimados para la distribución de la renta en España, lo que produce un índice de Gini igual a 1/3, que será la referencia como valor del parámetro poblacional. Para realizar el experimento se han generado mil muestras de tamaños 100, 500, 1 000 y 5 000, con el objetivo de analizar el grado de cobertura y la longitud de los intervalos de confianza mediante la teoría asintótica y los métodos bootstrap del percentil, BCA y boos trap-t.
En el cuadro 1 se presenta el grado de cobertura (proporción de intervalos de confianza que contenían el verdadero valor del parámetro) y la longitud media de los intervalos de confianza, con una cobertura nominal de 95%. Los resultados de dicho cuadro permiten concluir, en primer lugar, que la cobertura del método bootstrap-t con muestras pequeñas es mayor que la del resto de los métodos, como también señalan Giorgi, Palmitesta y Provasi (2005). Sin embargo, cuando el tamaño muestral es 1 000 y 5 000, las diferencias en la cobertura son insignificantes. En cuanto a la longitud, se observa que los intervalos más precisos son los proporcionados por el método del percentil para cualquier tamaño muestral.
n | Teoría asintótica | Método del percentil | BCA | Bootstrap-t | |||||||
Cobertura | Longitud | Cobertura | Longitud | Cobertura | Longitud | Cobertura | Longitud | ||||
100 | 0.8688 | 0.1148 | 0.8682 | 0.1156 | 0.8942 | 0.1210 | 0.9230 | 0.1620 | |||
500 | 0.9204 | 0.0603 | 0.9071 | 0.0596 | 0.9170 | 0.0625 | 0.9140 | 0.0716 | |||
1 000 | 0.9315 | 0.0449 | 0.9300 | 0.0448 | 0.9180 | 0.0468 | 0.9300 | 0.0487 | |||
5 000 | 0.9358 | 0.0371 | 0.9430 | 0.0206 | 0.9450 | 0.0211 | 0.9460 | 0.0237 |
Los resultados confirman, por tanto, la similitud de cobertura de todos los métodos en el caso de muestras grandes (como las que por lo común se dispone en las encuestas de hogares). En cuanto a las longitudes de los intervalos, éstas son inferiores en los casos del percentil y el boostrap-t, lo que puede implicar, para estos dos métodos, una mayor facilidad en la detección de diferencias significativas cuando se comparan dos estimaciones del índice de Gini. El método BCA no registra siempre una mejora en la cobertura respecto al percentil, excepto con las muestras más pequeñas. Para muestras grandes ambos métodos producen resultados similares, aunque las longitudes de los intervalos son escasamente inferiores en el caso del percentil.
Los métodos bootstrap-t y asintótico, aunque presentan coberturas mayores para muestras pequeñas, producen resultados similares a los otros dos métodos en el caso de muestras grandes. Esta circunstancia indica la conveniencia de la elección de los métodos bootstrap más sencillos y, entre ellos, el método del percentil, dado que, para muestras grandes, los resultados son semejantes a los de otros métodos más elaborados, que traerían consigo un gran costo computacional ante observaciones ponderadas y un tamaño muestral grande.
Hay que señalar finalmente que la forma paramétrica selecciona da (Dagum de tipo I) tiene una influencia decisiva en los resultados de la simulación; por tanto, los resultados que aquí se presentan son válidos para este caso concreto, en el que se ha escogido una función de densidad adecuada, entre otros, al caso español que se analizará en la sección siguiente.
IV. Análisis de sensibilidad de las técnicas de inferencia para los resultados del caso español (1993-2000)
Para comprobar si cambian significativamente las conclusiones respecto a la dinámica de la desigualdad en el caso español, hemos realizado contrastes y calculado los intervalos de confianza del índice de Gini durante el periodo 1993-2000, utilizando la teoría asintótica y los distintos métodos bootstraps.
Para analizar las distribuciones de renta de España en el periodo 1993-2000, se han utilizado todas las muestras de corte transversal6 procedentes del Phogue. El concepto de renta utilizado es el de renta disponible por hogar, tras sumar transferencias y deducir los impuestos y contribuciones a la seguridad social. La unidad de análisis es la persona. Por tanto, cada hogar recibe una ponderación proporcional al número de sus miembros y al peso que le asigna el diseño muestral. La escala de equivalencia utilizada es la de la OCDE modificada, que asigna el valor 1 al primer adulto en el hogar, cada adulto adicional recibe una ponderación de 0.5 y cada niño menor de 16 años una ponderación de 0.3.7 Los tamaños muestrales utilizados para el periodo 1993-2000 oscilan entre 7 142 para 1993 y 4 950 para 2000, lo que nos sitúa inicialmente en la línea de las conclusiones obtenidas para muestras grandes en la simulación realizada en la sección anterior.
En el cuadro 2 se presenta los resultados de los intervalos de confianza para el índice de Gini según los diferentes métodos de inferencia. En general, los intervalos muestran una gran similitud, aunque se observa una mayor aproximación entre los resultados obtenidos mediante varianzas asintóticas y la metodología bootstrap-t, así como entre los intervalos de los métodos percentil y BCA. Estos dos últimos métodos proporcionan siempre intervalos más estrechos, tal como ocurría en la simulación cuando las muestras eran más grandes.
n | Varianza asintótica | Bootstrap percentil | BCA | Bootstrap-t | |||||||
LI | LS | LI | LS | LI | LS | LI | LS | ||||
1993 | 0.3387 | 0.3471 | 0.3391 | 0.3467 | 0.3389 | 0.3465 | 0.3389 | 0.3473 | |||
1994 | 0.3329 | 0.3411 | 0.3336 | 0.3405 | 0.3336 | 0.3405 | 0.3332 | 0.3411 | |||
1995 | 0.3359 | 0.3474 | 0.3372 | 0.3461 | 0.3369 | 0.3460 | 0.3362 | 0.3470 | |||
1996 | 0.3459 | 0.3554 | 0.3466 | 0.3543 | 0.3465 | 0.3542 | 0.3459 | 0.3553 | |||
1997 | 0.3332 | 0.3432 | 0.3342 | 0.3418 | 0.3345 | 0.3422 | 0.3332 | 0.3439 | |||
1998 | 0.3249 | 0.3370 | 0.3269 | 0.3350 | 0.3268 | 0.3349 | 0.3249 | 0.3368 | |||
1999 | 0.3181 | 0.3295 | 0.3191 | 0.3292 | 0.3187 | 0.3285 | 0.3185 | 0.3294 | |||
2000 | 0.3195 | 0.3350 | 0.3220 | 0.3323 | 0.3220 | 0.3323 | 0.3201 | 0.3360 |
Los casos extremos de variabilidad en los límites superior e inferior se ilustran en la gráfica 1, en la que se representa los intervalos obtenidos en el año en el que son más parecidos (1993) y en el año en el que se aprecia mayores diferencias (2000). En es te último año la muestra sufre una importante reducción, lo que aumenta las longitudes de los intervalos y, por tanto, la posibilidad de que existan mayores diferencias entre métodos.
La utilización de las varianzas asintóticas para construir los pivotes de la metodología bootstrap-t puede explicar la similitud de los resultados que producen las dos metodologías. Por otra parte, la semejanza de los resultados del método percentil y BCA se explica, obviamente, por que este último no deja de ser una versión mejorada primero.
Si comparamos los extremos entre los métodos que producen resultados más dispares (asintótico-percentil, BCA-bootstrap-t, asintótico-BCA, percentil-bootstrap-t), las diferencias entre los límites de los intervalos están habitualmente en el tercer o cuarto decimal; esto supone que la mayor parte de dichas diferencias no llega a 1%. Si comparamos los resultados más próximos (asintótico-bootstrap-t y percentil-BCA), se producen algunas coincidencias completas de los extremos de los intervalos en los cuatro primeros decimales, siendo la diferencia máxima entre límites inferior a 0.3 por ciento.
Los resultados de los contrastes respecto a los índices de Gini de años consecutivos según los cuatro métodos de inferencia se presentan en el cuadro 3. Es importante señalar que, una vez realizados los contrastes, se observa claramente la necesidad de utilizar la inferencia estadística para comparar índices de Gini. En este sentido, si consideramos, por ejemplo, el repunte de la desigualdad indicado por el incremento del estimador puntual del índice de Gini en 2000, el contraste de hipótesis realizado revela ahora un cambio de la desigualdad irrelevante, carente de significación estadística.
Varianza asintótica |
Bootstrap-t | Percentil | BCA | ||
Incrementos/disminuciones significativos a 10% de significación | |||||
1993-1994 | − | − | − | − | |
1994-1995 | = | + | + | + | |
1995-1996 | + | + | + | + | |
1996-1997 | − | − | − | − | |
1997-1998 | − | − | − | − | |
1998-1999 | − | − | − | − | |
1999-2000 | = | = | = | = | |
Incrementos/disminuciones significativos a 5% de significación | |||||
1993-1994 | = | − | − | − | |
1994-1995 | = | = | = | = | |
1995-1996 | + | + | + | + | |
1996-1997 | − | − | − | − | |
1997-1998 | = | − | − | − | |
1998-1999 | = | − | − | − | |
1999-2000 | = | = | = | = |
Los resultados del cuadro 3 son idénticos para los métodos bootstrap-t, percentil y BCA, a los niveles del 5 y 10% de significación. Por tanto, la evolución de la desigualdad que se deduce de los tres métodos de inferencia es la misma. En el caso del método asintótico se observa una mayor presencia de igualdades, es decir, ausencia de variaciones significativas entre años consecutivos, en particular cuando se utiliza una significación del 5%. Si se aumenta la significación al 10%, las diferencias entre los resultados de contrastes de los cuatro métodos se reducen a la comparación de los índices de Gini de 1994 y 1995, en que la utilización del método de varianzas asintóticas nos lleva a descartar una variación significativa del índice, frente a los otros tres métodos que detectan un incremento significativo del indicador.
Por tanto, en líneas generales, las diferentes técnicas estadísticas con fluyen en establecer las siguientes fases de evolución de la desigualdad en España a partir del índice de Gini: una fa se de predominio de incrementos has ta 1996, una fase de descenso de la desigualdad hasta 1999 y una moderación de esta tendencia en 2000.8
Conclusiones
La utilización de técnicas de inferencia estadística en las estimaciones puntuales de los indicadores de desigualdad resulta indispensable por la presencia de errores muestrales que pueden alterar las conclusiones de la evolución del fenómeno. Así pues, en el estudio aquí realizado de la evolución del índice de Gini se comprueba que algunos incrementos y disminuciones de dicho estimador puntual se corresponden con variaciones que no resultan significativas, como demuestran los resultados de igualdad en los contrastes de hipótesis presenta dos en el cuadro 3. En es tos casos, la interpretación exclusiva de los incrementos o disminuciones de las estimaciones puntuales puede llevarnos a obtener conclusiones erróneas de la evolución de la desigualdad en los periodos de comparación.
La ausencia de consenso, en la bibliografía económica y estadística, en la utilización de una única técnica inferencial hace necesaria la realización de un análisis de sensibilidad que contribuya a determinar la influencia de la técnica en los resultados. En el presente trabajo es te análisis de sensibilidad se realiza, en una primera etapa, mediante un experimento de simulación utilizando la distribución de Dagum de tipo I. De dicho experimento se concluye una gran similitud de los resultados de los distintos métodos en el caso de muestras grandes, como las habitualmente utiliza das en estudios de desigualdad. Para es te tipo de muestras, los métodos bootstrap puros (percentil y BCA) originan intervalos más precisos que los obtenidos mediante la aproximación asintótica y el método bootstrap-t, aunque los niveles de cobertura son similares y próximos al nivel nominal. En el caso de muestras pequeñas, los métodos asintóticos y boostrap-t resultan más adecuados.
Los resultados del análisis aplicado al caso español, a partir de las muestras reales del Phogue (1993-2000), son similares a los obtenidos en el estudio de simulación pre vio para el caso de muestras grandes, obteniéndose intervalos de confianza muy similares para los distintos tipos de inferencia. En cualquier caso, hay que advertir que los métodos BCA y percentil, de menor costo computacional, son más precisos que los restantes.
Finalmente, teniendo en cuenta los resultados de los contrastes de hipótesis para las comparaciones interanuales de los índices de Gini, se concluye una pauta evolutiva similar para todas las metodologías de inferencia. La técnica asintótica presenta algunas particularidades debidas únicamente a la presencia de menos diferencias significativas en los resultados de los contrastes realizados con dicho método. Así pues, aunque la utilización de técnicas inferenciales es primordial para la obtención de conclusiones de la evolución del índice de Gini en España, la técnica de inferencia utilizada no es una elección que condicione en exceso los resultados obtenidos cuando se trabaja con muestras grandes. Gracias a esta similitud de resultados puede afirmarse que, en el periodo 1993-2000, el índice de Gini experimenta en España una fase de predominio de incrementos hasta 1996, una fase de descenso de la desigualdad hasta 1999 y una moderación de esta tendencia en 2000.