SciELO - Scientific Electronic Library Online

 
vol.17 número69La Demografía en México, las etapas iniciales de su evolución y sus aportaciones al desarrollo nacionalIntegración económica de los inmigrantes mexicanos en la Zona Metropolitana de Los Ángeles índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay artículos similaresSimilares en SciELO

Compartir


Papeles de población

versión On-line ISSN 2448-7147versión impresa ISSN 1405-7425

Pap. poblac vol.17 no.69 Toluca jul./sep. 2011

 

La obtención y proyección de tablas de mortalidad empleando curvas spline

 

Obtaining and projection of mortality tables using spline curves

 

Alejandro Mina-Valdés

 

El Colegio de México.

 

Recibido: el 16 de junio de 2011
Aprobado: el 27 de septiembre de 2011.

 

Resumen

Una de las herramientas del análisis numérico es el uso de polinomios de n-ésimo orden para interpolar entre n + 1 puntos, teniéndose casos en donde estas funciones polinómicas pueden llevar a resultados erróneos. Una alternativa es la de aplicar polinomios de orden inferior a subconjuntos de datos. Estos polinomios conectados se llaman funciones de interpolación segmentaria (spline functions). En este artículo se presenta la herramienta que el análisis numérico proporciona como instrumento técnico necesario para llevar a cabo todos los procedimientos matemáticos existentes con base a algoritmos que permitan su simulación o cálculo, en especial, las funciones splines definidas a trozos (por tramos), con interpolación mediante ellas, dando lugar a el ajuste de curvas spline con base en la serie de sobrevivientes lx de una tabla abreviada de mortalidad mexicana, con el fin de desagregarla por edad desplegada, respetando las concavidades que por el efecto de la mortalidad en las primeras edades y en las siguientes se tienen en la experiencia mexicana. También empleando las curvas splines se presentan las simulaciones que permiten obtener escenarios futuros de las series de sobrevivientes lx, que dan lugar a las proyecciones de la mortalidad mexicana para los años 2010-2050, las que generan las tablas completas de mortalidad para hombres y mujeres de dicho periodo, resaltando las diferencias entre sexos y edades de sus probabilidades de supervivencia y las ganancias en las esperanzas de vida.

Palabras clave: interpolación polinómica, splines, tablas de mortalidad.

 

Abstract

One of the tools of numerical analysis is the use of polynomials of Nth order to interpolate between n+1 points, taking cases where these polynomial functions can lead to erroneous results. An alternative is to implement polynomials of lesser order than the subsets of data. These connected polynomials are called functions of segmental interpolation (spline functions). This article introduces the tool provided by numerical analysis as a technical instrument needed to carry out all existing mathematical procedures based on algorithms to enable its simulation or calculation, in particular, the functions spline defined in ranges (by sections), with interpolation through them, giving rise to the adjustment of spline curves based on surviving an abbreviated table of Mexican mortality lx series in order to disaggregate by age deployed, respecting the cavities that because of the effect of mortality in the early and following ages appear in the Mexican experience. Also using splines the simulations that allow obtaining future scenarios of the surviving lx series produces the Mexican mortality for the years 2010-2050, projections that generate complete tables of mortality for men and women of this period, highlighting the differences between sexes and ages of their chances to survive and increments in life expectancy.

Key words: polynomial interpolation, splines, tables of mortality.

 

Introducción

El análisis numérico proporciona el instrumento técnico necesario para llevar a cabo todos los procedimientos matemáticos existentes con base a algoritmos que permitan su simulación o cálculo. En el subcampo matemático del análisis numérico, una curva spline es definida a trozos (por tramos) mediante polinomios, teniéndose que en los problemas de interpolación se utiliza a menudo la interpolación mediante splines porque da lugar a resultados similares requiriendo solamente el uso de polinomios de bajo grado, con la ventaja de que se evitan las oscilaciones, que en la mayoría de las aplicaciones resultan indeseables, las que aparecen al interpolar mediante polinomios de grado elevado, en general mayores a grado 3. El trabajo presenta el ajuste de curvas spline con base en la serie de sobrevivientes lx de una tabla abreviada de mortalidad mexicana, con el fin de desagregarla por edad desplegada, respetando las concavidades que por el efecto de la mortalidad en las primeras edades y en las siguientes se tienen en la experiencia mexicana.

Una ventaja del empleo de las curvas spline es la posibilidad de hacer simulaciones que permitan obtener escenarios futuros de las series de sobrevivientes lx, por ello también se obtendrán mediante los ajustes spline, proyecciones de la mortalidad mexicana para los años 2010-2050, generando las tablas completas de mortalidad para hombres y mujeres de dicho periodo, lo que permitirá la cuantificación de las ganancias en la esperanza de vida por edad y sexo en México.

 

Interpolación segmentaria

El concepto de interpolación segmentaria se originó de la técnica de uso de una lámina de plástico delgada (llamada curvígrafo, en inglés spline) en el trazo de curvas suaves a través de un conjunto de puntos. En esta técnica, el dibujante colocaba papel sobre un tablero de madera y clavaba tachuelas en el papel (y en el tablero) en la posición de los datos. Al pasar un hilo entre las tachuelas se describía una curva cúbica suave. De ahí que se haya adoptado el nombre de "interpelación segmentaria" (cubic spline) para polinomios de este tipo.

En el análisis numérico es posible usar polinomios de n-ésimo orden para interpolar entre n + 1 puntos. Por ejemplo, en ocho puntos, se deriva un polinomio perfecto de séptimo orden. Esta curva captura todos los serpenteos (al menos considera hasta derivadas de séptimo orden) sugeridos por los puntos. Sin embargo, existen casos en donde estas funciones pueden llevar a resultados erróneos. Una alternativa es la de aplicar polinomios de orden inferior a subconjuntos de datos. Estos polinomios conectados se llaman funciones de interpolación segmentaria (spline functions).

Por ejemplo, las curvas de tercer orden empleadas para conectar cada par de datos se llaman funciones de interpolación cúbica segmentaria (cubic splines). Estas funciones tienen la propiedad adicional de que las conexiones entre ecuaciones cúbicas adyacentes son visualmente suaves. En principio pareciera que la aproximación segmentaría de tercer orden es inferior a la expresión de séptimo orden, lo que no es así.

Ahora bien, el objetivo de la interpolación cúbica segmentaria es obtener polinomios de tercer orden para cada uno de los intervalos entre nodos de la forma:

Por to tanto, para los n + 1 puntos (i = 0, 1, 2,. . . , n), existen n intervalos y, por lo tanto, 4n incógnitas constantes por evaluar. Como se hace para polinomios cuadráticos, en este caso se requiere de cinco condiciones para evaluar las incógnitas. Estas son:

1. Los valores de la funcion deben ser iguales en los nodos interiores

2. (2n 2 condiciones).

3. La primera y la última función deben pasar a través de los puntos finales (dos condiciones).

4. Las primeras derivadas en los nodos interiores deben ser iguales (n - 1 condiciones).

5. Las segundas derivadas en los nodos interiores deben ser iguales (n - 1 condiciones).

6. Las segundas derivadas en los nodos finales son cero (dos condiciones).

La interpretación visual de la condición 5 es que la funcion sea una línea recta en los nodos finales. Debido a la especificación de esta condición es que se le llama interpolación segmentaria "natural". Se le da este nombre ya que el polinomio interpolante se comporta de manera natural en este esquema. Si el valor de la segunda derivada en los nodos finales fuese diferente de cero (es decir, existe alguna curvatura), entonces esta información se usaría alternativamente para proporcionar las dos condiciones necesarias.

Los cinco tipos anteriores de condiciones proporcionan un total de 4n ecuaciones necesarias para encontrar los 4n coeficientes. De esta manera es posible obtener una interpolación cúbica segmentaria. Una manera práctica de generar el ajuste segementario mediante un spline cúbico es llevando a cabo los siguientes pasos:

El primer paso en la obtención se basa en la observación de que debido a que cada pareja de nodos esta conectada por un polinomio cúbico, la segunda derivada dentro de cada intervalo es una línea recta. La ecuación (1) se puede derivar dos veces para verificar esta observación. Con base a lo anterior, las segundas derivadas se representan mediante los polinomios de interpolacion de primer orden de Lagrange:

En donde f"i(x) es el valor de la segunda derivada en el primer nodo x dentro del iesimo intervalo. Por to tanto, esta ecuación es una linea recta que conecta la segunda derivada en el primer nodo f"(x i-l) con la segunda derivada en el segundo nodof"(xi ).

Como segundo paso, la ecuación (2) se integra dos veces y se obtiene una expresión para fi(x). Sin embargo, esta expresión tiene dos incógnitas constantes de integración. Estas constantes se evalúan considerando las condiciones de equiespaciamiento f(x) debe ser igual f(xi-l) en xi-l yf(xi) debe ser igual a f(xi) en xi. Llevando a cabo estas evaluaciones, se obtiene la siguiente ecuación cúbica:

Cabe destacar que esta expresión es mucho más complicada para los polinomios de interpolación segmentaria en el i-ésimo intervalo, es decir, la ecuación (1). Sin embargo, nótese que esta contiene sólo dos "coeficientes" incógnitas, las segundas derivadas al principio y al final del intervalo, f"(xi-l) yf"(xi). Por lo tanto, si se determina propiamente la segunda derivada en cada nodo, la ecuaci6n (3) es un polinomio de tercer orden que se usa para interpolar dentro de un intervalo.

Las segundas derivadas se evalúan usando la condición de que las primeras derivadas en los nodos deben ser continuas:

La ecuación (3) se deriva y se obtiene una expresión de la primera derivada. Si esto se hace para los (i + 1)esimos a iésimos y los dos resultados se igualan, de acuerdo a la ecuación (4), obtenemos la siguiente relación:

Dado que la ecuación (5) se escribe para todos los nodos interiores, resultan n - 1 ecuaciones simultáneas con n + 1 segundas derivadas incógnitas. Sin embargo ya que este es un polinomio interpolante "natural", las segundas derivadas en los nodos finales son cero y el problema reduce a n - 1 ecuaciones con n - 1 incógnitas. Ademas notése que el sistema de ecuaciones será tridiagonal. Por lo tanto, no sólo se tiene que reducir el número de ecuaciones sino que también se calculan de forma que sean muy fáciles de resolver.

Finalmente, la derivación genera las siguientes ecuaciones cúbicas para cada intervalo:

La ecuación contiene únicamente dos incógnitas, las segundas derivadas al final de cada intervalo. Dichas incógnitas se evalúan usando la ecuación siguiente:

Como esta ecuación se escribe para todos los nodos interiores, se generan n -1 incógnitas (segundas derivadas en los nodos finales son cero).

Cabe mencionar que las splines cúbicas han resultado ser las más adecuadas para aplicaciones como la mencionada anteriormente.

Así pues, podemos decir de manera concreta, que una función spline está formada por varios polinomios, cada uno definido en un intervalo y que se unen entre sí bajo ciertas condiciones de continuidad.

Para un spline de grado k, suponemos que x0 < x1 < ... xn, y dado k un número entero positivo, una función de interpolación spline de grado k, para la tabla de datos, es una función s(x) tal que:

i) s(xi) = yi, para toda i = 0, 1,..., n.

ii) s(xi) es un polinomio de grado < k en cada subintervalo [xi-1, xi].

iii ) s(xi) tiene derivada contínua hasta de orden k - 1 en [x0, xn].

Así, para una función spline de grado uno que interpole los datos es simplemente unir cada uno de los puntos mediante segmentos de recta, entonces:

donde:

i) sj (x) es un polinomio de grado menor o igual que 1.

ii) s(x) tiene derivada continua de orden k-1 =0.

iii) s(xj) = yj, para j = 0, 1,..., n .

Por lo tanto, la spline de grado 1 queda definida como:

donde f [xi, xj] es la diferencia dividida de Newton.

El siguiente caso, que es el más importante en las aplicaciones, sigue exactamente los mismos pasos del ejemplo que acabamos de resolver, solamente que en vez de trabajar con polinomios cuadráticos, lo hace con polinomios cúbicos.

Y para una spline cúbica que interpola n + 1 datos, es una función s(x) tal que:

donde cada si(x) es un polinomio cúbico; si(x) = yi, para toda i = 0, 1,..., n y tal que si(x) tiene primera y segunda derivadas contínuas en [x0, xn].

 

Resultados obtenidos con la aplicación spline

Empleando los splines podemos desagregar las estructuras por edades de la población que tenemos por grupos quinquenales de edades en edades individuales, con el fin de tener los denominadores de las tasas específicas de mortalidad para la elaboración de las tablas completas de vida.

En términos prácticos, se desea desagregar el histograma o pirámide de población, de barras que representan grupos quinquenales a barras que representen edades individuales.

El algoritmo que lo permite, empleando los splines, se detalla a continuación, comparando sus resultados con los que se obtienen con el uso de los factores que Henry Beers obtuvo con sus fórmulas de interpolación.1

Supongamos: x1< x2 < x3 <...< xn + 1, y que hi es la altura de la barra correspondiente al intervalo [xi, x1 + 1].

Sea hi la frecuencia observada en la i-ésima clase.

Entonces hi(xi + 1 - xi) = hi Δxi representa la frecuencia relativa fr(i) en el intervalo [xi, xi + 1]

donde fa(i) es la frecuencia absoluta de la i-ésima clase.

La función de densidad permite calcular la probabilidad de que la variable tome valores en un cierto intervalo [a,b] y es igual a:

y el valor esperado de x y su desviación estándar:

la condición del spline parabólico f que suaviza el histograma es:

Para cada sección Pi (x) de f se puede escribir vía la fórmula de Taylor como:

El problema fundamental consiste en escoger los polinomios r1(x), r2(x) y r3 (x) tales que:

sean:

r1 (x)= (1-y) (1-3y)= 1-4y + 3y2

r2 (x)= y(3y-2) = 3y2-2y

r3 (y)= 6y(1-y) = 6y-6y2

Nótese que:

Y ya que en el histograma se satisface que:

Finalmente:

f(x) = Pi(x) = f(xi)ri(y) + f(xi+1)r2(y) + hir3(y)

Para garantizar la continuidad, se obtiene para xi < xi - 1

De tal manera que la condición de continuidad de f': P' i-l (xi)= P'i (xi), i=2,..., n, es tal que:

Δxi f(i-1) + 2 (Δxi+Δxi-1 f(xi) + Δxi-1 f(xi+1)= 3Δxi hi-1 + Δxi-1 hi

tomando:

entonces:

Matricialmente:

y para corregir los extremos se tiene que:

2 f (x1) + f (x2)= 3hi = e1

y f (xn) + 2f (xn+1)= 3hn = en+1

Modificándose el sistema matricial a:

En el ajuste y proyección de las funciones de supervivencia, que permiten la elaboración de tablas de vida desagregadas por edad, se han empleado funciones como la Gompertz, Gompertz-Makeham, y Lazarus, entre otras, las que tiene el problema del ajuste de ellas en las primeras edades, ya que la concavidad no se ajusta a dichas funciones, si bien es cierto que lo hacen para el resto de las edades.

Con el ajuste de interpolación segmentaria (spline) se logra superar el problema ya que al ajustarse un polinomio de grado tres en las primeras edades la concavidad se conserva en el ajuste.

Una de las ventajas del ajuste spline es que la tendencia de las probabilidades de muerte nqx de las tablas de vida son consistentes con las tendencias observadas, hecho que no necesariamente se da en los ajustes tipo Gompertz-Makeham.

El spline obtenido de los sobrevivientes a edad exacta (lx) por sexo, para el año 2010, por nodos especificados en rango de edades es:

Las tablas de vida por edad individual, para hombres y mujeres a nivel nacional para el año 2010, obtenida con el ajuste spline son:

Cuadro 2

Y las esperanzas de vida que se obtuvieron con el ajuste spline-lx proyectando los parámetros de los polinomios por nodos, para los años 2010 al 2050, por edad y sexo, tomadas de tablas de vida completas obtenidas son:

 

A manera de conclusión

Las ganancias en la esperanza de vida, que se espera tendrá la población mexicana en los próximos 40 años, obtenidas a partir del las tablas de vida completas obtenidas por ajuste y proyección spline-lx, para hombres y mujeres, son:

Gráfica 5

 

Bibliografía

HENRICI, P., 1982, Essential of numerical analysis, John Wiley & Sons, New York.         [ Links ]

HILDEBRAND, Francis, 1987, Introduction to numerical analysis, McGraw-Hill, Inc.         [ Links ]

KINCAID, David, Ward CHENEY, 1994, Análisis numérico. Las matemáticas del cálculo científico, Addison-Wesley Iberoamericana.         [ Links ]

MINA VALDÉS, Alejandro, 2001, "Funciones de sobrevivencia, empleadas en el análisis demográfico", en revista Papeles de Población, núm. 28, abr-jun, CIEAP-UAEM, Toluca, México.         [ Links ]

MINA VALDÉS, Alejandro, 2006, "Ley de mortalidad mexicana, funciones de supervivencia", en Revista Estudios Demográficos y Urbanos, vol. 21, núm. 2.         [ Links ]

 

Nota

1 Ver: Beers Henry, "Six-Term Formulas for Routine Actuarial Interpolation" en Record of the American Institute of Actuaries, vol.34, june, 1945.

 

Información sobre el autor:

Alejandro MINA-VALDÉS. Actuario y Matemático por la Universidad Nacional Autónoma de México. Maestro en Demografía por El Colegio de México. Profesor-Investigador de tiempo completo del Centro de Estudios Demográficos Urbanos y Ambientales de El Colegio de México de 1979 a la fecha. Miembro del Sistema Nacional de Investigadores. Entre sus publicaciones más importantes destaca el capítulo tres, tomo uno, de la obra: Los grandes problemas de México, editado por El Colegio de México en 2010, Evolución de la mortalidad en México: pasado, presente y futuro. Correo electrónico: amina@colmex.mx

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons