Saltar al contenido principal

Métodos para la mejora de técnicas estadísticas

Código: 07 00 06PAAE: 2017Tipo: consolidada

Ámbito: 07. Metodología y normalización

Organismos responsables: Instituto de Estadística de Cataluña

Organismos colaboradores: centros de investigación, universidades catalanas

Coste directo estimado: 35.000 €

Reseña: Desarrollo y aplicación de técnicas estadísticas para la mejora cualitativa y cuantitativa de los procesos de producción estadística. Entre estos métodos se incluyen: - Los procedimientos estadísticos y computacionales orientados a la preservación del secreto estadístico en el tratamiento de los microdatos (registros individuales) y los macrodatos (datos tabulados). - Los estimadores de pequeña área, con el objetivo de obtener resultados territoriales fiables minimizando la dimensión de las muestras, y las técnicas de integración de datos (fusión y cotejo) de encuestas y/o administrativas, con el objetivo de reducir al máximo la carga que soportan las unidades informantes.

Fases del proceso estadístico: —.

Informante: —

Unidad de información: —

Técnica de recogida de los datos de la operación de campo propia: —

Origen de la información: —

Variables principales: —

Desagregación territorial de los resultados: —

Periodo de referencia: —

Periodicidad: —

Calendario de disponibilidad de los resultados sintéticos: —

Canal de difusión: —

Dirección abreviada: https://idescat.cat/paae/2017/070006/es

Cumplimiento

Grado de cumplimiento: La actuación se ha llevado a cabo.

Información disponible:

Se ha avanzado mucho en la fase de investigación metodológica para la mejora del tratamiento de ajuste de calendario y estacional de los indicadores de coyuntura y macromagnitudes según lo establecido en las últimas recomendaciones europeas. Se han llevado a cabo simulaciones para evaluar el impacto de la modelización, especialmente de las intervenciones y días festivos, con el software JDemetra+ recomendado oficialmente por Eurostat. También se ha ampliado el paquete 'JDLight' de R, publicado por el Banco Nacional de Bélgica, para adaptarlo a las necesidades de modelización, simulación y producción a gran escala del Idescat.

Se ha consolidado el proyecto de 'nowcasting' para obtener previsiones del PIB a un horizonte de t+30 días mediante métodos directos. Además de implementar los métodos basados en la bibliografía que tanto el AIReF como algunas reservas federales de EE.UU. han publicado sobre el uso de modelos dinámicos factoriales, también se están evaluando los nuevos paquetes de R orientados a la estimación de estos modelos. La variedad de resultados derivada del uso de diferentes modelos ha motivado la investigación y desarrollo de algunas técnicas de combinación de previsiones. Por otra parte, se ha diseñado e implementado, íntegramente en R, un sistema de carga diaria automático para obtener indicadores de coyuntura de diversas fuentes oficiales que alimentan los procedimientos de nowcasting. El sistema accede a una gran variedad de recursos web externos, vía HTTP o JSON, así como las bases de datos internas, vía ODBC.

Se ha iniciado un proyecto para automatizar todo el proceso de cálculo de la contabilidad trimestral y el avance del PIB. Para desarrollarlo, se ha centralizado en un sistema de scripts (R) la lectura de fuentes de datos, el ajuste estacional, la desagregación temporal y todos los cálculos necesarios para la generación de un VAB para cada rama, tanto en precios corrientes como en volumen y desde la perspectiva de la oferta como de la demanda. Paralelamente, se han auditado los métodos de trimestralización empleados en estos procesos y se ha hecho una evaluación de algunas alternativas metodológicas mediante análisis de sensibilidad.

Con el objetivo de difundir datos de población georeferenciados que preserven la confidencialidad se ha optado por la utilización de grids multiresolución (quadtree), de tal forma que en zonas de elevada densidad de población la resolución del grid sea máxima y en zonas de baja densidad de población la resolución sea mínima. Estos parámetros, resolución máxima y mínima quedan determinados por un umbral arbitrario. Se han evaluado tanto el valor del umbral como los de resolución máxima y mínima utilizando métodos de Monte Carlo para estimar el error en el cálculo de efectivos de población y tomar decisiones en relación a estos tres parámetros. Además se han establecido métodos de traslación para minimizar el error en zonas con gran varianza entre elementos hermanos en la jerarquía definida en el grid multiresolución, evitando así agregaciones espaciales no deseables. Se ha establecido que para un umbral de 17 personas, las resoluciones máxima y mínima óptimas son 125m y 250m respectivamente y que la media del error relativo en el cálculo de efectivos de población es del 5%, para estos valores

Resultados publicados:

NTTS 2017: Statistical disclousure control on visualising geocoded population data using a structure in quadtrees

La información sobre los resultados de la actuación también puede descargarse desde el web del Idescat:

Statistical disclousure control on visualising geocoded population data using a structure in quadtrees. Abstract (PDF)

Statistical disclousure control on visualising geocoded population data using a structure in quadtrees. Presentation (PDF)

Statistical disclousure control on visualising geocoded population data using a structure in quadtrees. Poster (PDF)

Para conocer el significado de estos campos, consulte el apartado Contenidos de la ficha descriptiva de la actuación estadística.