Introducción
Los Censos de Población, Hogares y Viviendas (CPHyV) son la fuente de información sociodemográfica más importante de los países. Si bien en Argentina tienen un rol relevante, los datos de los registros administrativos alcanzan distintos niveles de calidad a lo largo del tiempo, y la información que recaban es de escaso detalle. Asimismo, el reducido número de encuestas de hogares, en comparación con las que cuentan otros países, y sus limitadas posibilidades de desagregación geográfica, son factores que posicionan a los censos como una de las pocas fuentes de información confiable en una gran cantidad de aspectos.
De acuerdo con las estimaciones indirectas realizadas por la Organización de las Naciones Unidas (ONU) desde la ronda de 1960 -que da comienzo a la etapa de censos modernos (Giusti, 2007)-, Argentina mantuvo altos niveles de cobertura en sus Censos de Población, Hogares y Viviendas (CPHyV) (ONU, 2015; Borges y Sacco, 2016). En un contexto general de intensa discusión sobre los resultados del CPHyV de 2010 -o “Censo del Bicentenario” (CEN-10)-, Sacco (2015), González et al. (2013) y el Instituto Nacional de Estadística y Censos (INDEC, 2013) han realizado estimaciones que ubican al CEN-10 en los niveles históricos de omisión en Argentina (Borges y Sacco, 2016).
Si bien se cuenta con estas investigaciones previas, no se conocen antecedentes que complementen la omisión de población en conjunto con supuestos de cobertura de viviendas y hogares, universos que inciden de forma directa e indirecta en la cobertura de población. Por esta razón, el objetivo de este artículo es llevar a cabo otras estrategias de evaluación de cobertura de población, con métodos demográficos que complementen las ya instrumentadas, e integrar esta indagación con una estimación sobre la cobertura de viviendas y hogares con base en la escasa información disponible al respecto.
En este aspecto, dado el universo limitado de publicaciones por parte del INDEC, este ejercicio entra en un ámbito más especulativo, con un análisis que de momento se utiliza como conjetural para el trabajo a futuro. Los datos analizados son los de dominio público, teniendo en cuenta no sólo el potencial grado de error de estas estimaciones, sino también el acceso y la réplica que implica el uso de tal material. Delimitando el campo de lo que es posible evaluar y también de lo que no lo es, en función de la información disponible, el argumento central del artículo es que la posibilidad de detectar y cuantificar la omisión total se mantiene (y se mantendrá) como un límite hasta en tanto se cuente con información que complemente los exámenes parciales propuestos y se publique la totalidad de la información necesaria para realizar un examen íntegro. Aunque parezca contradictorio, los resultados de estas tareas mostrarán que las estadísticas podrán ser “razonablemente correctas”, pero al mismo tiempo, “sospechosas”.
Los CPHyV son utilizados en una variedad de aplicaciones tanto por el gobierno nacional como por las empresas y la academia. El objetivo constitucional del censo es proveer a los estados y gobiernos locales información que fundamente la distribución y redistribución de representantes en múltiples distritos de gobierno. Este uso específico hace que la precisión de sus cifras sea particularmente necesaria.
La existencia de problemas de cobertura es intrínseca a las actividades, de gran magnitud, que tienen estos operativos. Por ello, su evaluación y medición son de suma importancia. Esta evaluación es posible gracias a un conjunto de técnicas demográficas que permiten la medición de las diferencias entre las cifras del censo y las correspondientes a otros recuentos. La estimación de la cobertura es un aspecto de la evaluación global de la calidad de un censo: su medición aborda la fase cuantitativa de evaluación general de la cobertura, e incluye, además, aproximaciones cualitativas. La disimilitud entre los censos y los recuentos y/o proyecciones contraste, coherentes a nivel individual, vivienda u hogar, se conoce como error de cobertura del censo u omisión. La evaluación también es importante para mostrar dónde hay falencias, con el fin de apoyar las decisiones para mejorar el próximo censo.
Reconociendo la importancia de que el diferencial de cobertura es dependiente según los distintos grupos sociales, este artículo se concentra en el análisis de la cobertura general; es decir, no entra en detalle sobre diferencias por edad (véase al respecto Sacco, 2015), región u otras características. A su vez, la hipótesis de trabajo es que la cobertura censal a nivel Argentina mejoró, teniendo en cuenta sus niveles de forma comparativa con otros países de América Latina y en el tiempo. Una serie de preguntas-guía funcionan como hipótesis: ¿Cuál fue el nivel de cobertura del último censo en Argentina y cuán diferentes fueron sus valores de los registrados históricamente? ¿Cuáles son las principales razones que han llevado a una subenumeración en el CEN-10?
Buscando primeras respuestas a estas preguntas (y posibles explicaciones), el artículo se divide en cinco partes. Primero se aborda el Marco conceptual desde el cual se realiza el análisis, basado en las recomendaciones de los organismos internacionales. En la sección Actualización cartográfica se describen las características que adquirió esta etapa precensal, en orden de vincularla con las observaciones de las secciones subsiguientes. Luego se abordan los antecedentes sobre las estimaciones de Cobertura de población y se les compara con las tendencias tanto históricas como regionales. En la sección Métodos se describen los datos y métodos utilizados para complementar las investigaciones previas, mientras que en la sección Cobertura de viviendas y hogares se provee, con la pequeña evidencia empírica disponible, de complementos para el análisis de cobertura de población, con el fin de aportar conjeturas para revisar las diferencias encontradas.
Marco conceptual
La tarea de evaluar datos censales es una parte esencial para identificar la naturaleza, dirección, magnitud y significado de sus errores (Moultrie y otros, 2013). Se distinguen dos tipos de errores: de cobertura y de contenido. Los primeros se refieren a la completitud de la inclusión de personas, viviendas, hogares (unidades de análisis) o eventos en el sistema de datos. Los de contenido aluden a la precisión de las características registradas en el sistema de datos (Celade, 2014).
Chakiel y Macció (1978) señalaron que las tareas de evaluación, corrección y ajuste de los datos demográficos se hacen muy necesarias en los países latinoamericanos, dadas las diferencias de calidad con respecto a los censos de los países desarrollados. Los principios básicos para realizar una evaluación demográfica cambiaron poco desde la publicación de los manuales de la ONU, revisados y modificados (1955, 2010). Recientes guías de evaluación de datos censales (Bureau of the Census, 1985; Celade, 2011b; Moultrie y otros, 2013; Celade, 2014) complementan esos manuales, junto con las principales recomendaciones internacionales para las estadísticas vitales (ONU, 2014) y para la organización de las estadísticas públicas ONU, 2003, 2013a).
La ONU (2010: 75) sostuvo que existe un consenso generalizado en relacionar a la calidad de un censo con la satisfacción de las necesidades de los usuarios, y no sencillamente vincularlo a la exactitud o los errores que afectan las estimaciones de los relevamientos censales. Al definir la calidad como un concepto multidimensional, considera que la misma es el resultado conjunto de los procesos y no de los individuos que forman parte de ese proceso. La ONU sugiere que los procesos deben mostrar: i) validez metodológica; ii) eficiencia; iii) ambiente legal propicio para la actividad estadística; iv) mecanismos de planificación y procedimientos de sistematización de procesos para la planificación estadística a largo plazo, y v) recursos adecuados (ONU, 2010).
También distingue fuentes de invalidez de acuerdo con la etapa censal en la que se producen: durante las actividades precensales, en el trabajo de campo y en la etapa poscensal (ONU, 2010: 13-14). Además, estas definiciones categorizan los tipos de invalidez según los distintos factores que pueden asumir diferentes modalidades: al azar o sistemáticos. Estas causales de invalidez pueden evaluarse con posterioridad al relevamiento, de acuerdo con sus manifestaciones en los datos, tales como: omisión de unidades de relevamiento (viviendas y/o hogares y/o población); no respuesta; inconsistencias, particularmente respecto de información que proveen fuentes de datos externas; e inclusiones indebidas.
Según la ONU (2011) los errores de cobertura corresponden a omisiones o duplicaciones de personas o viviendas durante el empadronamiento. Pueden deberse a distintas razones: mapas incompletos o inexactos, los empadronadores no visitaron las zonas asignadas, conteo doble de personas, omisión de personas, no respuesta, o destrucción de registros luego del empadronamiento. También pueden ocurrir por problemas conceptuales debidos a errores tanto de los censistas como por fallos del informante, que considera que no debe declarar algunas personas, como los niños. En general, este tipo de errores debería corregirse en terreno.
Para observar si todas las unidades de observación fueron alcanzadas (personas, viviendas, hogares) existen distintos métodos de medición de omisión, directos e indirectos. Por un lado, la encuesta de entrevista poscensal es el método directo más frecuente, que implica una vuelta a campo (Chakiel y Macció, 1978; ONU 2010; Celade, 2014). Por el otro, la conciliación censal (Celade, 1984; Rincón, 1984; Arretx, 1989) es un método indirecto de carácter demográfico que se realiza en el momento de elaborar las estimaciones y proyecciones de población. Cualquiera que sea el método elegido, en general los resultados deberían ser similares. Si no son afines, se deberían poder explicar las diferencias. Uno de los propósitos de las evaluaciones censales es que una fuente de evaluación debe valer como validación de otra.
Sobre estas definiciones conceptuales y metodológicas este artículo analiza la cobertura del CEN-10, con base en lo publicado por el INDEC (2012). Para ello, se aborda una descripción de la etapa precensal y luego de la etapa poscensal.
Actualización cartográfica
La actualización previa al operativo censal, es decir, la actualización del territorio y el listado de viviendas, son actividades fundamentales porque dan lugar a la construcción del dato actualizado sobre la ubicación y sobre la cantidad de viviendas. La planificación del preempadronamiento suele ser una tarea muy compleja y debe ser realizada teniendo en cuenta las posteriores etapas. Esto requiere el diagnóstico, formulación y evaluación precensal, así como también el desarrollo del proyecto censal y de factibilidad, y que además se realice siguiendo una evaluación general del último CPHyV (Celade, 2011b: 19).
En Argentina, el decreto para la realización del CEN-10 se formuló en enero de 2010, por lo cual muchas de las tareas precensales probablemente hayan visto reducidos sus lapsos de preparación, sobre todo teniendo en cuenta que en censos anteriores se incluyeron en la agenda del Sistema Estadístico Nacional (SEN) con mayor anticipación (AEPA, 2010: 4) .
La experiencia previa y el CEN-10
En el Censo Nacional de Población y Viviendas de 1991 (CEN-91) se realizó un conteo de viviendas en todas las localidades un año antes del comienzo del operativo, mientras que el Censo Nacional de Población, Hogares y Viviendas 2001 (CEN-01) se ejecutó en localidades de 50 mil y más habitantes. En el CEN-10 se realizó de igual manera que el CEN-01, pero al retrasarse las tareas precensales se decidió que para las localidades que no contaran con el listado de viviendas se utilizarían los datos precensales de 2001 (ATE-INDEC, 2010; INDEC, 2010d).
En el CEN-91 los trabajos de segmentación y vuelco de la cantidad de viviendas en la cartografía se realizaron de forma manual (ATE-INDEC, 2010), y en el CEN-01 casi todo fue digitalizado (INDEC, 2001). En el CEN-10 también se utilizó tecnología digital y en algunos casos se agregó fotografía satelital, pero los trabajos y desarrollos de programación comenzaron ocho meses antes del operativo ( ATE-INDEC, 2010). La corta distancia de tiempo entre el operativo censal y el proceso de segmentación de todas las tareas precensales (UBA, 2010: 23) probablemente hayan aumentado los posibles errores en los programas de volcado.
La desactualización y la creciente demanda de información entre censo y censo, en la medida que transcurre el tiempo entre el último operativo censal, perjudican el diseño de políticas públicas y su monitoreo, sobre todo en contextos de grandes cambios sociales y económicos como los que vivió Argentina entre 2001 y 2010. El Centro Latinoamericano de Demografía (Celade, 2011a: 20) recomendó, por estas razones, llevar a cabo conteos intercensales de población y vivienda en América Latina, tanto para lograr una mejor cobertura y control del empadronamiento, evitando posibles problemas de omisión, como para determinar con mayor precisión las áreas de empadronamiento censal.
Según el INDEC (2007) se preveía realizar un conteo de población y viviendas en el periodo intercensal, pero no fue llevado a cabo. La no ejecución de este plan, junto con el retraso relativo de las tareas de listado y conteo, pudieron haber afectado el proceso de actualización cartográfica para el CEN-10, sobre todo en un contexto de crecimiento del parque habitacional. En algunas localidades donde se utilizó el dato de 2001, probablemente haya habido un desfase entre el dato del 2010 y el del 2001 (ATE-INDEC, 2010), muy difícil de medir con exactitud.
Este retraso de las tareas preparatorias de actualización y conteo de viviendas, que obligó en muchos casos a utilizar información precensal del 2001, pudo haber incidido en los datos de cobertura sobre el total de población. Estos errores son difíciles de medir y, por ello es complejo cuantificar cómo afectaron a los resultados censales.
Cobertura de población
La experiencia previa y el CEN-10
En el CEN-01 se realizó un ejercicio de estimación de la omisión censal a partir de métodos demográficos (INDEC, 2005b; Massa, 2006). La omisión resultante del análisis de conciliación censal fue de 2.75%, mientras que la encuesta poscensal (INDEC, 2001) dio resultados del orden del 7%, información que no fue publicada (INDEC, 2010b: 4).
Como complemento a ese análisis, se elaboró una estimación de población para cada jurisdicción a la fecha censal (INDEC, 2005b; Massa, 2006). Comparando el conteo precensal de viviendas y luego el empadronamiento censal de éstas, se estimó la subenumeración del empadronamiento. Ese procedimiento contó con la posibilidad de realizar estimaciones con base en el conteo y el listado previo de las viviendas (datos de las planillas resumen del jefe de radio) sobre las cuales se pudieron estimar, a su vez, el total de entrevistas realizadas y no realizadas (Massa y otros, 2005). A partir de ello, se pudo rastrear parte de los problemas derivados del operativo censal y las diferencias encontradas entre las viviendas efectivamente censadas y las que se esperaban en base al conteo. Sumado al análisis de la información proveniente de las viviendas con habitantes ausentes, se consiguió estimar la subenumeración censal de las viviendas y su posible influencia en la subenumeración de la población asociada.
Para el caso del CEN-10 este listado de viviendas tuvo diversos problemas -tal como se mencionó previamente- y las planillas (o la información resumen sobre ellas) no se publicaron. El INDEC no ha hecho público documento alguno sobre el proceso de conteo ni sobre la estimación de viviendas del censo, por lo que una estimación de la omisión censal (directa) de viviendas no es posible. Adicionalmente, se desconocen las razones por las cuales se descartó realizar la encuesta poscensal como elemento para medir la cobertura del CEN-10.1
Estimaciones indirectas
De acuerdo con los trabajos que investigaron los niveles de cobertura en los censos de la región (Mortara y otros, 1964; Celade, 1968; Arretx y Chakiel, 1985; Tacla Chamy, 2006; Borges y Sacco, 2016) se observa que los niveles de omisión históricos de Argentina fueron relativamente bajos en comparación con el resto de América Latina.
González, Ribotta y Torres (2013) realizaron un estudio del grado de omisión del CEN-10 basándose en proyecciones de población. Allí descubrieron que el nivel de omisión del CEN-10 fue de 2.4%; mayor en los varones (3.3%) que en las mujeres (1.6%). La estimación oficial del INDEC (2013), siguiendo el método indirecto de componentes, publicó que el nivel de omisión del CEN-10 fue de 1.9% para ambos sexos, siendo también diferencial entre varones (2.4%) y mujeres (1.5%). Estos resultados fueron más altos que en los censos anteriores de 1980 (1.0%) y 1991 (0.9%), para ambos sexos, respectivamente (véase el Cuadro 1).
En este artículo se realizaron dos ejercicios adicionales de estimación a fin de complementar y comparar estas investigaciones previas.
Métodos
Ecuación compensadora
La primera aproximación propuesta es la de realizar un análisis al nivel de cobertura del CEN-10 basado en la comparación de los resultados definitivos con el crecimiento natural estimado para el periodo intercensal. Se pretende con ello elaborar una hipótesis sobre el grado de omisión del CEN-10 a través de la técnica basada en Celade (1968). El procedimiento se basa en la ecuación compensadora y se sustenta en los datos provenientes de los censos y en la información de las estadísticas vitales (EV)2 (Rincón, 1984: 11; Celade, 2014: 57-60). Este modelo adopta la forma siguiente:
El método de conciliación basado en la ecuación compensadora se apoya en el principio básico siguiente: la población (N t) censada por edad y sexo en el momento z está determinada por los sobrevivientes de población censada en un momento anterior z-n (N 0), más los nacimientos (B) menos las defunciones (D), y el saldo migratorio neto, del periodo intercensal (Celade, 1968).
La población base considerada fue la censada en 2001, corregida por cobertura y conciliación censal al 30 de junio de 2001 por el INDEC (2005c: 8). A esta población se añadieron las EV, aquellas que se refieren a los nacimientos por sexo y a las defunciones por sexo intercensales (véase los Cuadros A1, A2 y A3 del Anexo). Estos datos fueron ajustados: se distribuyeron proporcionalmente (mitad a cada sexo) las defunciones y los nacimientos sin sexo especificado. No se han realizado ajustes por subregistro de defunciones o de nacimientos o de inscripción tardía, ya que se supone que las estadísticas vitales, durante el periodo intercensal, fueron de calidad satisfactoria (Bay y Orellana, 2007), y la cobertura fue completa tanto en el registro de nacimientos (Fernández y otros, 2008; OMS, 2012) como de defunciones (Ribotta, 2013).
Se adoptó también la hipótesis de que los nacimientos anuales se distribuyeron de forma proporcional a lo largo del año. Se consideró, para los nacimientos del año 2001 y los nacimientos del 2010, su división entre dos para hacer una estimación al 30 de junio. Para el resto de los años se tomó el total de los nacimientos y las defunciones.
Las hipótesis de saldo migratorio con las cuales se trabajó, al no disponer de registros anuales de migrantes para el total nacional, fueron las estimaciones realizadas por el INDEC (2013: 18) para sus últimas proyecciones de población, y también las realizadas por la ONU (2013b).3
La población considerada del censo 2010 fue la población definitiva publicada ajustada al 30 de junio de 2010 por un factor de corrección que tomó en cuenta la tasa de crecimiento medio anual intercensal del periodo 2001-2010 (tomando la población base para las proyecciones del 2001), interpolando los valores entre estas dos poblaciones de acuerdo con las distribuciones por edad, y empleando una función de crecimiento exponencial.4
Teniendo en cuenta todos los supuestos señalados, las diferencias obtenidas deberán interpretarse, en caso de ser positivas, como población omitida por el CEN-10; y si las diferencias son negativas, como un menor conteo de datos vitales con respecto al censo, errores en la población base considerada o problemas en la hipótesis de migración adoptada. Puede suceder, también, que se encuentren errores de todos estos tipos, compensándose entre sí, atenuando los efectos de unos y otros.
De la aplicación de este ejercicio, la omisión total resulta de 2.1% (2.9% para varones y 1.3% en mujeres) (véase el Cuadro 2). La cifra obtenida da cuenta de la importancia que se estima alcanzó la omisión censal para Argentina en 2010. El resultado es cercano a una magnitud significativa, de 900 000 personas (588 495 y 270 530, para varones y mujeres, respectivamente). Si se tiene en cuenta que en CEN-01 tuvo una omisión total de 2.7%, el CEN-10 parecía contar, en principio, con un grado menor de omisión que el censo anterior (si se aceptan los supuestos aquí adoptados).5 Las diferencias totales y por sexos se registran en línea por lo observado en 2001 y por el ejercicio realizado en Borges y Sacco (2016), González et. al. (2013) y el INDEC (2013), y están por debajo del nivel promedio de América Latina en las rondas censales del 2000 (3.2%) (Chackiel, 2009b: 8) y del 2010 (4.2%) (Borges y Sacco, 2016).
* Dato ilustrativo. Fuentes: a: CEN-01 (INDEC, 2001); b: INDEC, 2005c; c: EV; d: EV; e: INDEC, 2013; f: INDEC, 2010b; g: CEN-10 (INDEC, 2012); h: elaboración propia con base en CEN-01 (INDEC, 2001); i: INDEC (2005c).
Distribución intercensal por edad
La otra metodología aplicada siguió la distribución de la población por edad, teniendo en cuenta las muertes intercensales, de modo de estimar las tasas de mortalidad por edad durante el periodo (ONU, 1986: 225-236). Siguiendo a Hill (1987), se ha demostrado que en cualquier población, para el periodo intercensal, existe la siguiente relación:
donde N(a) y N(a+) son el número de años-personas vividos a la edad exacta a, y a la edad a y más, respectivamente, durante el periodo intercensal; r(a+) es la tasa específica de crecimiento acumulada; D(a+) son las muertes intercensales registradas para las edades a y más; t es el intervalo del periodo intercensal; K es la cobertura de enumeración del segundo censo con respecto al primero, y C es la cobertura del registro de muerte durante el periodo intercensal. Los valores de K y C se suponen invariantes con la edad. En la práctica, N(a) y N(a+) son calculados a partir del recuento de población por edad y sexo del censo.
La razón de muertes intercensales con respecto a la población intercensal está linealmente relacionada con una medida fácilmente calculable a partir de dos poblaciones censales. El ajuste que se puede realizar basado en una regresión de mínimos cuadrados permite realizar estimaciones de cobertura del segundo censo con respecto al primero(ONU, 1986: 225-236) .
Utilizando las muertes intercensales por edad provenientes de datos vitales como insumo para realizar distintos cálculos (para más detalle véase Sacco, 2015), los resultados de aplicar esta técnica indicaron que la cobertura de la población enumerada del censo de octubre de 2010 fue de alrededor de 2.5% más completa para varones y de 1.6% para mujeres, con respecto al censo de 2001. Este ejercicio podría estar revelando, adicionalmente, una leve mejora en el registro de varones entre un censo y otro (véase los Cuadros 3 y 4).6
Fuente: Elaboración propia con base en CEN-01 (INDEC, 2001); CEN-10 (INDEC, 2010); y Estadísticas Vitales (DEIS, varios años).
Fuente: Elaboración propia con base en CEN-01 (INDEC, 2001); CEN-10 (INDEC, 2010); y Estadísticas Vitales (DEIS, varios años).
Como en otras ocasiones, al aceptar que no hay problemas de calidad serios en las estadísticas vitales, la aplicación de la ecuación compensadora mostró resultados alineados con otras aproximaciones. Los resultados de los ejercicios aquí descritos pueden tener limitaciones, derivadas principalmente de los supuestos y de las estimaciones realizadas para llegar a los nacimientos y las defunciones, y en cuanto a la hipótesis de migraciones. La magnitud de la migración estimada no parece ser sustancial, ya que, si se supone que el saldo fuera dos veces mayor al calculado, no afectaría mucho el resultado final.
Lo hasta aquí examinado muestra que existió una omisión baja con respecto al contexto regional, pero que, empero, no deja de ser muy significativa tanto en términos relativos como absolutos. El INDEC (2010b: 3) consideró altos los niveles de omisión del 2001; por lo tanto, si bien se observa un menor nivel con respecto al censo anterior, se sigue manteniendo con leves mejoras sustantivas y todavía por encima de lo observado en el CEN-80 y el CEN-91.
El análisis hasta aquí abordado se complementa en conjunto con el análisis de cobertura de viviendas y hogares, que se realiza periódicamente. Cabe concluir preliminarmente que, dado que en otras ocasiones el INDEC, coherentemente, propuso un doble y hasta triple sistema de estimación como parte de su metodología, y que en el CEN-10 la encuesta poscensal no se realizó (por razones que no son obvias, y que la falta de presupuesto no agota), lo que resulta incierto en términos de evaluación es que no existan publicaciones de estimaciones con base en información precensal. Si se contara con esos datos se facilitaría la tarea de evaluación y se daría la oportunidad de realizar otras comparaciones de cobertura.
Cobertura de viviendas y hogares
En el CEN-01 no se enumeraron las viviendas. La carátula de ubicación geográfica consignaba el número de cédula censal donde cada número correspondía a un hogar, pero no al número de vivienda, tal como se hizo en el CEN-10 (Sacco, 2015). Al no estar dicho número de vivienda en el cuestionario del CEN-01 (y sólo presente en las planillas de campo de los jefes de radio) se debieron reconstruir las viviendas en gabinete mediante el procesamiento de la información de ubicación geográfica, utilizando, a partir de ciertos supuestos teóricos, variables auxiliares (INDEC, 2004b).
En el CEN-10 las viviendas y los hogares fueron contabilizados con otro procedimiento. Esto es doblemente importante porque posibilitaría cotejar los resultados del conteo previo de viviendas -que padeció diversos problemas- con los resultados del censo de viviendas propiamente; y tal ejercicio de estimación será necesariamente sensible a los sesgos producidos por la actualización cartográfica del CEN-10 que, como se señaló, empleó en distintas localidades información de las viviendas del CEN-01, reconstruidas de forma muy distinta al proceso de 2010.
Con esos datos, no disponibles para usuarios aún, se conseguiría realizar una evaluación más precisa de la calidad y la cobertura de los universos de viviendas y hogares relevados, tanto de forma directa como indirecta de población. Al no contar con la información de referencia de viviendas y/o datos secundarios que indiquen el crecimiento del parque habitacional, la evaluación de los niveles de omisión de viviendas y hogares queda seriamente restringida a la circularidad de los propios resultados censales (es decir, a los supuestos).
Como se muestra en el Cuadro 5, se advierten, en principio, valores coherentes tanto en los totales como en la distribución de las categorías de condición de ocupación de las viviendas (tipo de unidad de entrevista) y tipo de vivienda, al comparar el CEN-01 y el CEN-10. Se observa un crecimiento de las viviendas particulares habitadas (del 85.6% en el CEN-01 al 88.6% en el CEN-10) junto a un descenso de las viviendas particulares deshabitadas (del 14.3 al 11.2%). El resto de las categorías se mantiene estable. En las viviendas particulares habitadas quienes sostienen principalmente el crecimiento son las viviendas con personas temporalmente ausentes.
Si se desglosa el universo de viviendas particulares, la información relativa a su condición de ocupación muestra que el porcentaje de viviendas con personas temporalmente ausentes, dentro del total de los motivos de no realización de la entrevista, fue el 26.2% en el CEN-01 y el 37.8% en el CEN-10. Las viviendas en alquiler o venta redujeron su participación, pasando de 13.6% en el CEN-01 a 10.9% en el CEN-10. Aquellas en construcción y de uso temporal se encuentran en un nivel relativamente estable en ambos censos, mientras que las viviendas de uso comercial se reducen sensiblemente, pasando de 9.8 a 6.6% en 2010. Otras causas también pierden su participación, pasando de 28.4% en el CEN-01 a 23.0% en el CEN-10 (véase el Cuadro 6).
Los casos clasificados en la categoría “vivienda con personas temporalmente ausentes” corresponden a las viviendas donde no se realizó́ la entrevista porque no se pudo contactar a los residentes de la vivienda, pero se sabe que ella es habitada por informes de los vecinos o por señas visibles de residencia. En esta categoría también debieron incluirse los casos donde no se encontró un informante calificado en la vivienda visitada en el momento del censo. El manual del censista especifica que la vivienda se clasificaba como con personas temporalmente ausentes después de al menos dos visitas fallidas (INDEC, 2010c: 31).
Imputación
Para garantía y revisión de la calidad de los datos, el INDEC decidió utilizar el programa Canceis (Canadian Census Edit and Imputation System) (Bankier y otros, 2001), especialmente desarrollado para el análisis de consistencia y reparación de datos (INDEC, 2011a), siguiendo las recomendaciones internacionales que sugieren utilizar este tipo de métodos (ONU, 2011: 189-192). Si bien este programa cuenta con pruebas realizadas para Canadá y Estados Unidos (Bycroft y Seyb, 2004; Chen, 2007), aparentemente no hubo experiencias locales previas suficientes al levantamiento de los datos del CEN-10. Se desconoce la magnitud de los problemas detectados en el diseño y el contenido del cuestionario que se observaron durante el proceso de depuración de la base de datos. Sólo algunas pautas de imputación fueron descritas en INDEC (2011b). Lo que este tipo de programas realiza es, en preguntas sin dato o sin respuesta, una corrección para que todos los casos queden con información. Aparentemente no se decidió mantener códigos sin información.
¿Se han seguido las recomendaciones internacionales para la revisión del censo? Probablemente, pero se desconoce en qué magnitud. ¿Ha habido casos de imputación de viviendas con habitantes ausentes, pero información completa de las personas que residen en una vivienda similar, la cual es elegida a través de un algoritmo que considera el tipo de vivienda y la cercanía geográfica? ¿Se han “poblado” viviendas con habitantes ausentes, reemplazando información de viviendas con habitantes presentes, tal como se hizo con los resultados del censo experimental? No se sabe.
Si bien sí se conoce que este tipo de aplicación fue implementada en los censos de otros países (de derecho en la mayoría) como en Brasil, México y Uruguay, entre otros, sólo en el caso de Chile (Bianchini y otros, 2013: 56) -cuyo censo tuvo gran cantidad de problemas de calidad- no se informó al público cuando se difundieron los resultados. Al contrario del caso chileno, Uruguay anunció este procedimiento desde la primera emisión de los datos,7 y en los microdatos los casos imputados de distintas formas fueron marcados con una variable específica, de modo tal que el usuario pueda identificar cuando se trató de casos “clonados” en viviendas ocupadas con moradores ausentes (Cabella y otros, 2012).
En Brasil este procedimiento fue adoptado por primera vez en 2007 y repetido en 2010, sin mediar mucha discusión al respecto. El método implementado utilizó información de los domicilios que estaban “cerrados” y después fueron “abiertos”, tratando de consignar de forma más cercana lo que se esperaría en esos casos.8 En la práctica parecería que no ha funcionado tan bien: los hogares donde no se encontraron las personas tienen características muy distintas de aquellas en las que se aplicó el censo. A pesar de eso, en el caso de Brasil las primeras publicaciones ya daban cuenta a los usuarios de estas imputaciones,9 pero luego fue poco a poco detallándose menos, hasta el punto en el cual ya la mayoría de los usuarios considera esta población como censada.10
Como se ve, ésta fue una cuestión muy importante relativa a la ronda censal 2010 en algunos países de América Latina. Lo que puede intuirse de estas operaciones de imputación es que, a pesar de que existen razones técnicas de peso para llevar a cabo estos procedimientos, pueden ser también utilizados como uno de los dispositivos de los institutos para disminuir sus brechas de cobertura.
Dado que las recomendaciones internacionales sugieren que las bases de microdatos censales estén disponibles para todo tipo de usuarios, debería ser posible contar con toda la documentación necesaria para su correcto manejo e interpretación (ONU, 2011). Sobre todo, contar con las previsiones e instrucciones para el análisis en aquellas variables o regiones geográficas a donde la imputación fue de magnitud considerable; o donde, para completar la cobertura de moradores ausentes, se utilizaron las estimaciones de población en viviendas censadas. Para ello deberían publicarse los antecedentes, procedimientos, metodologías, soluciones y decisiones estratégicas que han sido adoptadas en la construcción de la base de datos.
Si tan buena es la calidad del censo y se trata del “mejor de la historia”, qué mejor que lograr más calidad dando aun la posibilidad a distintos usuarios de identificar las marcas de modificación de datos por consistencia mediante la publicación de las bases de datos en diferentes estados, preconsistencia, posconsistencia y definitivas. En todo caso, si esto no se considera viable, sería pertinente publicar, como se hizo con el CEN-91 (INDEC, 1997) y el CEN-01 (INDEC, 2005a), la evaluación de calidad de los datos conforme a los errores de registro y de coherencia.
Discusión
¿Cuáles son las razones que explicarían la proporción de omisión censal en el CEN-10? ¿La omisión de personas se originó en viviendas con moradores ausentes (habitadas, pero donde no se logró el contacto para la entrevista)?, ¿o se debió a que la entrevista no fue realizada en un conjunto de viviendas porque no fueron censadas?, o bien, ¿se debió a una subenumeración de personas en un número de viviendas donde se realizó la entrevista? ¿No habrán sido incorrectamente enumeradas también las viviendas deshabitadas, debido al alto número encontrado de ellas?
No es claro en qué medida pudo haberse calificado como viviendas deshabitadas a viviendas ocupadas con personas temporalmente ausentes, pero se contó con un equipo de control de calidad en gabinete, recuperadores y supervisión en terreno. No se sabe si pudo haber una supervisión indirecta posterior con respecto a estos hogares, ya que los resultados de la supervisión no se conocen.
La evolución de las viviendas según su “condición de ocupación” puede mostrar, de forma amplia, problemas de cobertura, de viviendas o de personas. Los inconvenientes en la cobertura de viviendas pueden originarse en la cartografía, en una errónea interpretación del censista en su recorrido o en la instrucción relativa al manejo de la cédula censal. Al mismo tiempo, los problemas de cobertura de población pueden producirse, entre otras cosas, por una carga mal distribuida del tiempo de trabajo de cada censista, dificultades en la difusión del operativo o en la alta movilidad de la población el día designado (AEPA, 2010). La población omitida se compone por omisión, fruto de los habitantes ausentes en viviendas que fueron ya censadas y por la omisión propiamente dicha; es decir, aquella población residente en viviendas no censadas o población no declarada en viviendas y hogares censados. La diferencia entre un componente y otro es por las viviendas que fueron censadas y las que no.
Para mantener la comparabilidad con las mediciones realizadas por censos anteriores y para contabilizar la población con la mayor exactitud posible, no sería del todo inadecuado realizar ejercicios que lleven a un íntegro conteo de la población de modo tal de no inducir a conclusiones inexactas sobre el grado de crecimiento intercensal, uno de los objetivos principales de todo censo.
En base a los resultados del Censo Experimental de 2009, el INDEC realizó una estimación del total de habitantes mediante un ajuste de datos a nivel de radio censal, imputando viviendas con moradores ausentes al promedio de habitantes por radio. Como señaló AEPA (2010), ya en censos anteriores se había registrado un importante número de viviendas “con moradores ausentes” y “deshabitadas”, obviamente, dependiente de cada zona en particular.11
En el análisis demográfico, los ajustes de datos se realizan con fines metodológicos con el objetivo de tomar la población base para la elaboración de proyecciones y estimaciones de población. En general no se suelen tomar para ello poblaciones en las que la diferencia entre el conteo y el ajuste aplicado es tan importante como la realizada en el Censo Experimental.
Teniendo el antecedente del Censo Experimental de 2009 y, como se mencionó previamente, el hecho de no disponer del detalle de los datos sobre el conteo precensal de viviendas puede ser señal de alerta sobre la posible imputación de viviendas con personas temporalmente ausentes, reemplazando información de viviendas con habitantes presentes, “poblando” esas viviendas.12 Ésta no es una práctica ajena a otros institutos de estadística. La estimación de población en viviendas con habitantes ausentes se efectuó en muchos países de la región que en general llevan a cabo censos de derecho, tales como México, Uruguay, Venezuela, y entre otros países del resto del mundo como Estados Unidos, Canadá, Reino Unido y Australia.13
Si el INDEC decidió o no realizar imputaciones a la información de hogares y población en viviendas ocupadas con habitantes ausentes, no estaría fuera de línea con la práctica de otros países. En todo caso si esto no fue lo realizado, hasta el momento tal información aún no ha sido especificada (a la inversa del usual procedimiento en otros institutos de estadística). Lo que sí no se conocen son experiencias internacionales que avalen una metodología para la estimación de viviendas no cubiertas por el proceso de levantamiento y la imputación de sus habitantes, ya que tales viviendas y habitantes no son parte de los resultados del proceso censal, sino que corresponden a la omisión censal y les concierne que sean estimados como parte del proceso de conciliación demográfica.
El número de viviendas particulares clasificadas como con personas temporalmente ausentes fue moderadamente alto tanto en el CEN-01 como en el CEN-10. Creció entre ambos censos: representaba el 5.0% de las viviendas particulares habitadas en 2001 y ascendió al 6.8% en 2010 (véase el Cuadro 5). La tasa de crecimiento -exponencial- de este tipo de ocupación de viviendas fue del 48.7 por mil en el lapso 2001-2010, muy por encima del 17.1 por mil de la tasa registrada en viviendas particulares habitadas (véase el Cuadro 6) en el mismo periodo. A pesar de que en el CEN-01 no hubo un empadronamiento de viviendas propiamente dicho, al comparar las tasas, derivadas de dos metodologías distintas, podría deducirse que, en este aspecto, es un indicador bastante directo de pérdida de cobertura del CEN-10 con respecto al CEN-01, pues se sabe que son viviendas habitadas pero las personas no fueron censadas.
El crecimiento de este tipo de ocupación muestra que posiblemente no se hayan dado casos de imputación de población a estas viviendas, dado que, si hubiese pasado, debieron haberse asignado personas en esta categoría. Las explicaciones posibles de este fenómeno exceden las posibilidades analíticas de este artículo dada la falta de publicaciones al respecto. Lo que no se entiende muy bien es el crecimiento observado de esta condición de ocupación de viviendas registrada en el CEN-10 con respecto al CEN-01. El valor, ya alto en el censo previo, pudo deberse en aquel momento a la propia jornada de trabajo de los censistas en la coyuntura social, política y económica del 2001, a la modalidad del censo (de hecho) y/o a otras situaciones imposibles de saber con exactitud.
Puede suceder que en los censos de hecho, donde las personas fueron relevadas respecto al lugar donde durmieron la noche anterior al día del censo, que aquellas ausentes de su lugar de residencia habitual pudieran haber sido censadas en el lugar donde pernoctaron. Ello implicaría que al visitar una vivienda con habitantes ausentes, las personas pueden no haber sido omitidas del conteo censal dado que sí habían sido captadas, posiblemente, en la vivienda donde hayan trasnochado.
En general, la presencia de viviendas particulares con habitantes ausentes se presenta con mayor incidencia en los censos de derecho, pero no así en los censos de hecho, en los cuales la persona quizás fue registrada en el lugar en que durmió la noche del día de referencia del censo (aunque no sea su residencia habitual). Por lo anterior, es difícil concluir, a partir de los datos publicados, en qué medida todos los residentes habituales de vivienda con habitantes ausentes en el momento del censo fueron censados en algún lugar del país (en la vivienda donde durmió la noche de la fecha de referencia del censo).
Conjeturas
De acuerdo con los datos disponibles, es posible realizar otros ejercicios de estimación si se concede entrar en un ámbito más especulativo, siguiendo ya no solamente lo poco publicado, sino lo inédito. Considerando lo que no se muestra, se podrían hacer algunos análisis con base en supuestos amplios, tratando de deducir lo descrito previamente.
En primer lugar, una de las tantas posibles situaciones que podrían explicar los niveles de cobertura es la clasificación incorrecta de viviendas con personas ausentes en lugar de deshabitadas. No hay evaluación realizada por parte del INDEC que dé cuenta de esta posible inexactitud. Pero uno de los factores que tradicionalmente puede suceder en los censos es que pudieron haber casos de omisión de viviendas por las probables viviendas calificadas erróneamente como deshabitadas.14
En el CEN-10 se identificó como deshabitadas a 11.2% del total de viviendas visitadas (véase el Cuadro 5), que representa una participación levemente inferior con respecto al CEN-01 (14.3%).15 En este grupo se incluía también a las viviendas en alquiler o venta, en construcción, usadas con fines comerciales, uso temporal y otras razones. No obstante, en una medida difícil de precisar, es probable que algunos de estos casos hayan correspondido a viviendas con personas temporalmente ausentes. Y viceversa, pueden haberse dado casos de clasificación de viviendas con personas temporalmente ausentes, cuando en realidad correspondía ubicarlas en la categoría de deshabitadas. Con las viviendas que incluyeron a las de uso temporal y las viviendas propiamente desocupadas, pudo ocurrir que hayan sido clasificadas como deshabitadas o con personas temporalmente ausentes.
En segundo lugar, los recuperadores pudieron haber puesto más atención en viviendas clasificadas efectivamente como con personas temporalmente ausentes, pero no tanto en las deshabitadas. El INDEC (2011a: 22) informó que censó a 100 mil personas de forma telefónica e implementó el operativo de recuperación hasta una semana después del día del censo. No queda bien claro si este operativo telefónico refiere efectivamente a personas o bien a hogares (ya que no se entiende bien por qué censar telefónicamente a 100 mil personas si lo que hace falta es un respondente por hogar). En todo caso, estos dos hechos muestran ciertos indicios (implicaría un estimado de 326 mil personas16 censadas de forma telefónica) de lo que pudo haber sido la magnitud de la errónea clasificación de viviendas como deshabitadas o como con personas temporalmente ausentes. Aunque en general no se observan valores llamativos con respecto a una posible mala calificación, el informe del proceso de supervisión y recuperación (no publicado) es muy importante para evaluar cuáles fueron las posibles dimensiones de la mala clasificación, si las hubo.
Tercero: el INDEC prometió publicar los resultados preliminares del censo dentro de las 48 horas posteriores al día del censo, pero fueron hechos públicos casi dos meses después.17 Probablemente, y con muchas diferencias entre distintas unidades geográficas, debió haber divergencias entre la población esperada, la contada, la distribución por sexo o la cantidad de hogares. Posiblemente vinculado a la inconsistencia, omisión e inexactitud de datos, o bien a problemas en su procesamiento y a la no realización de la encuesta poscensal, el retraso en casi dos meses de la publicación de los resultados provisionales sólo se explica por estos supuestos.18
Si bien las diferencias de este último análisis entre los resultados provisionales y los definitivos del CEN-10 (0.06%) es pequeña (a nivel del total del país, pero no en algunas provincias en particular) y es incluso menor que lo registrado en el CEN-01 (0.10%), pero mayor que en el CEN-91 (0.02%), su efecto podría no ser un factor del todo relevante en una posible explicación de las viviendas deshabitadas o las viviendas con personas temporalmente ausentes. Lo que sí es llamativo es el retraso en su publicación, la no realización de la encuesta poscensal y la exclusión del estudio de las planillas de jefes de radio para el análisis de cobertura de la población (dependiente de la exhaustividad del censo de viviendas).
En cuarto lugar, otra de las posibles fuentes de explicación en la que es muy difícil profundizar se encuentra en las diferencias entre el conteo previo de viviendas y las viviendas no censadas, ya que no se conocen marcos de referencia como los que hay en la población para el caso de las viviendas.19 En efecto, y a diferencia de los casos anteriores, las viviendas clasificadas como deshabitadas o con personas temporalmente ausentes son de unidades que el censista supuestamente visitó. La secuela que pudo producir la omisión de viviendas no visitadas es muy difícil de evaluar dado que el conteo previo de viviendas no fue exhaustivo. Sin embargo, puede suponerse que, si bien no habría habido una omisión censal significativa de viviendas, es muy factible que haya habido problemas de cobertura, en este sentido, diferenciales por regiones o segmentos específicos.
Por último, tres análisis pueden plantearse. El primero y relacionado a lo anterior, puede indagarse si hubo algún tipo de subenumeración de personas en viviendas habitadas (y hogares). Bajo el supuesto de cambios lineales en el periodo intercensal debería verificarse una tendencia a la reducción del número de personas por vivienda (y hogar) por razones demográficas y, al mismo tiempo, socioeconómicas. Se espera que el promedio de personas por vivienda particular con personas presentes tenga una tendencia descendente, en tanto se percibe un descenso de la fecundidad, una tendencia al aumento de hogares unipersonales (dado el crecimiento en la estructura por edad de los grupos de edades avanzadas) y una cantidad mayor de parejas sin hijos; tres situaciones observables en la dinámica demográfica de Argentina durante el periodo 2001-2010.
De acuerdo con el Cuadro 7, el número promedio de personas en viviendas particulares fue de 3.83 en el CEN-91, de 3.70 en el CEN-01 y 3.51 en el CEN-10 (con una tendencia similar a nivel hogar). Estos valores representan un descenso del 5.1% en la media de personas por vivienda en el último periodo intercensal, número que, a falta de otra información, no parecería indicar pérdida en la cobertura de personas dentro de las viviendas censadas (al mismo tiempo se observa un llamativo crecimiento en la cantidad promedio de hogares por vivienda y una mayor concentración de esos hogares -aumento en el porcentaje de hogares que comparten vivienda- en el último periodo intercensal).20
Segundo, si se toma el promedio de personas por viviendas particulares habitadas con personas presentes en el CEN-10 (3.51) (Cuadro 7) y se le multiplica por el número de viviendas particulares habitadas con personas temporalmente ausentes (942 255) (véase el Cuadro 5), el total de población resulta de 3 307 315 personas. Es decir, bajo el supuesto de que el promedio de personas en viviendas no censadas por ausencia temporal es igual al promedio observado en las viviendas habitadas con personas presentes, habría habido una omisión de personas del 8.2% con respecto a la población definitiva.
De acuerdo con este planteamiento, agregando estos valores (es decir, la población así estimada en 2010: 3 307 315 personas) al ejercicio de cobertura de población realizado previamente, el CEN-10 no habría contado con una omisión de población cercana al 2%, sino que tendría una subenumeración de personas del orden del 6%. Si bien los supuestos aquí adoptados son muy amplios, estos resultados no dejan de resultar curiosos y podrían estar dando cuenta de posibles errores de distinto tipo: en la clasificación de viviendas por tipo de ocupación o bien en la omisión de unidades de vivienda, y, por ende, de hogares y población; o también en una imputación incorrecta de viviendas, hogares y personas.
Independientemente del ejercicio del párrafo anterior (que entra en un aspecto meramente especulativo), y, aunque sea arriesgado, teniendo en cuenta los problemas de datos de viviendas de 2001, en tercer y último lugar pueden observarse las tasas de crecimiento de las viviendas en el último periodo intercensal (véase el Cuadro 8). La tasa anual media de crecimiento de las viviendas particulares es positiva en ambos periodos intercensales, mayor en el lapso 2001-2010 (17.1 por mil) que en el decenio 1991-2001 (12.5 por mil). Los valores positivos en las tasas de crecimiento de viviendas indican su aumento, dato coherente con un crecimiento demográfico y económico -predominante- entre censos. El mayor crecimiento relativo de las viviendas en el periodo intercensal con respecto a la población puede ser una posible indicación de la pérdida potencial de cobertura de población en viviendas con personas presentes del CEN-10, con respecto al CEN-01, o de problemas de clasificación de las viviendas por tipo de ocupación.
Fuente: Elaboración propia con base en CEN-91 (INDEC, 1991); CEN-01 (INDEC, 2001) y CEN-10 (INDEC, 2010).
Por un lado, se acrecientan las tasas en los tres universos de observación, siendo las tasas de crecimiento de hogares las que más aumento muestran, seguido de las de viviendas y, por último, las de personas. Segundo, el aumento de las tasas de vivienda por encima de las de población se da también en un contexto donde el promedio de personas por vivienda en el CEN-10 es levemente inferior al del CEN-01, lo que podría ser también indicativo de una subenumeración de personas en las viviendas (ya que se esperaría que las diferencias promedio de personas por vivienda sean mayores a las observadas).
Conclusiones
El CEN-10 presenta niveles de omisión más altos con respecto a los censos de 1980 y 1991, aunque bajos dentro del contexto regional. Los niveles de población omitida al aplicar distintas metodologías de estimación mostraron compatibilidad entre ellas y con la dinámica demográfica. Esto no quiere decir que se supongan definitivas ya que pueden ser puestas a revisión permanente, sobre todo a partir de los supuestos asumidos y la información disponible, no olvidando que la omisión total resulta de la combinación de viviendas no censadas, viviendas censadas con subdeclaración de integrantes y viviendas censadas con habitantes ausentes. Sin una evaluación directa (encuesta de posempadronamiento), no se contó con instrumentos de evaluación adicionales independientes. La cuestión que se mantiene pendiente de dilucidar, a falta de otra información que aborde esta problemática, es si hubo un ajuste estadístico que favoreció un determinado resultado final.
En la etapa precensal hubo problemas de gestión que retrasaron la puesta en marcha y el desarrollo del operativo, acaso debido en gran parte a la discontinuidad del personal entre el inicio de las tareas precensales y la preparación del censo, o bien ante el clima institucional del INDEC (Sacco, 2015). Los problemas relativos a la premura de los plazos probablemente hayan tenido incidencias, no verificables, sobre la cobertura, calidad y oportunidad de la información.
La accesibilidad y los metadatos están condicionados a la información publicada y corregida. En este sentido, estas dimensiones muestran que fueron las que menos se han suscrito a los métodos y estándares internacionales. La no publicación de las pautas de imputación de las variables y unidades de análisis (población, viviendas y hogares), de los niveles de error de las variables, del conteo de viviendas previo y el atraso en la publicación de resultados provisorios, son los factores que inciden a la hora de evaluar la validez metodológica del CEN-10 como sólida con base en los resultados analizados; de acuerdo con lo no publicado, quedan muchas preguntas abiertas. Y dado que la variabilidad y los criterios empleados en esos factores están directamente relacionados con la cobertura censal de unidades de análisis, de la cual dependen el resto de las variables, esa solidez también queda cuestionada.
Dentro de los perjuicios que pueda conllevar una revisión excesiva del censo, la ONU (2011: 15) señala: i) la puntualidad, ii) el costo, iii) la distorsión de los valores reales, y iv) la creación de una falsa sensación de seguridad con respecto a la calidad de los datos. El CEN-10 estuvo en algunos aspectos dentro de los márgenes de las normas estándar y prácticas internacionales, pero distintos procesos podrían estar mostrando perjuicios de revisión.
A partir de la evaluación de los documentos publicados y los puntos de referencia internacionales sobre principios, recomendaciones y directrices, resulta primordial que los resultados del censo sean difundidos con una documentación detallada que permita a los usuarios evaluar la adecuación de los datos para los usos que ellos consideren. Si esto fuera publicado funcionaría en un doble sentido: por un lado, a favor del propio mejoramiento y corroboración sin incertidumbres de la calidad del censo; y por el otro, se podría constatar si el porcentaje de datos faltantes y los niveles de error e imputación fueron bajos, y si la tasa de no respuesta de las viviendas ocupadas y el porcentaje de las viviendas desocupadas con habitantes ausentes no están alejados de la experiencia de otros países con censos de hecho. Porque es la interacción entre usuarios e instituto el ámbito que posibilita y construye el espacio para la evaluación, permanente, de los datos censales.
En términos de coherencia o consistencia, los procedimientos del CEN-10, los supuestos en que se basan y los resultados que se obtienen guardan coherencia entre sí, y las cifras que surgen de las estimaciones censales muestran armonía aceptable con la ecuación de equilibrio demográfico y con las estadísticas vitales. Pero en términos de transparencia, en la cuestión de la determinación de la omisión censal, invariablemente debatible, han intervenido circunstancias que pueden afectar la credibilidad de los resultados publicados. El peor resultado que puede tener un censo desde el punto de vista del cumplimiento de sus propios objetivos no es que sus datos muestren distintos problemas de calidad, sino que no se utilicen o se dude de las cifras obtenidas (Torrado, 2004).
Las razones de estos problemas de validez metodológica y eficiencia quizás haya que buscarlas en los mecanismos de planificación, en los procedimientos de sistematización de los procesos que se han instituido a lo largo de la historia estadística y en la estructura financiera y de personal; análisis que, por sus dimensiones, no fue realizado.
El CEN-10, si bien muestra niveles de cobertura relativamente aceptados dentro de los valores de los organismos internacionales, debe contar con resguardos importantes en tanto se publiquen documentos metodológicos que confirmen sus distintos niveles de calidad en los procesos. Al menos desde los procedimientos que se analizan en este artículo, todavía quedan muchos pendientes para saber qué tan lejos está el CEN-10 de haber sido el mejor o el peor censo de la historia.
¿Cierran los números con la gente adentro? Sí, cierran, pero falta todavía mucho por contar.