Saltar al contenido principal

9. Investigación y desarrollo

Durante el año 2022 se han desarrollado varias líneas de innovación, entre las que destacan las siguientes líneas de ámbito transversal:

  • Registro estadístico de territorio
  • Sistemas de georeferenciación
  • Sistema integrado de metadatos (Qualitas)

Por otra parte, el Idescat ha dedicado recursos a las siguientes líneas de innovación técnica o metodológica de carácter más vertical:

  • Encuesta de condiciones de vida (ECV)
  • Encuesta de la financiación y el gasto de la enseñanza privada (EFDE)
  • Encuesta del empleo del tiempo (EET)
  • Sistema estadístico de información laboral
  • Desarrollo de la Estadística de comercio con el extranjero y de la Estadística de comercio con el extranjero según contenido tecnológico en la Plataforma Cerdà
  • Desarrollo de la Estadística de la actividad del turismo rural en la Plataforma Cerdà
  • Desarrollo de sistemas de perturbación en la difusión de la Estadística del empleo asalariado y autónomo según afiliaciones a la Seguridad Social
  • Desarrollo de los métodos de validación de direcciones y geocodificación de la información de afiliaciones y cuentas de cotización en la Seguridad Social
  • Indicadores de la economía circular
  • Proyecto experimental de web scraping

También se han realizado mejoras conceptuales en estadísticas económicas sectoriales, que se detallan en el apartado correspondiente.

9.1. Líneas de innovación estadística

Líneas de ámbito transversal

Registro estadístico de territorio

Objetivo: Mejorar la calidad y la exhaustividad del Registro estadístico de territorio. En 2022 se han geocodificado por primera vez las direcciones de las cuentas de cotización de la Tesorería General de la Seguridad Social y las direcciones de trabajo de los autónomos afiliados. Para llevar a cabo estos trabajos, se ha creado una nueva aplicación en JAVA para el tratamiento de las direcciones que no se han podido codificar de forma automática. Esta aplicación utiliza Google Web Tool-kit (GWT) para desarrollar en JAVA la parte de cliente y se han utilizado herramientas de Open Layers (OL) para la visualización de las direcciones en mapas. La aplicación proporciona, para cada dirección a geocodificar, una lista de direcciones del mismo municipio similares en cuanto al tipo y nombre de la vía. Al seleccionar manualmente una dirección de las candidatas, esta se visualiza en un mapa y permite diferentes opciones (asignarla como correcta, avanzar a la siguiente sin eliminarla o asignarla como dirección no localizada). La aplicación realiza una serie de tratamientos para extraer automáticamente el tipo de vía, eliminar las partes innecesarias de la dirección o asignar el número de calle. Adicionalmente permite asignar una dirección concreta a partir de su selección en el mapa.

Sistemas de georeferenciación

Objetivo 1: Disponer de una red de transporte para encontrar caminos óptimos entre dos puntos, así como poder calcular los costes asociados en espacio y tiempo.

Se trata de una información básica para conocer la distribución de costes que tiene la población para llegar a ciertas infraestructuras dependiendo de la localización de la que disponen muchas aplicaciones, por ejemplo para tomar decisiones en relación con la posición de ciertas infraestructuras futuras.

Se han analizado las diferentes fuentes y se ha optado por utilizar la información disponible en el proyecto Open Street Maps (OSM). Se han descargado los datos de carreteras relativos al territorio de Cataluña, así como los correspondientes a Aragón y los departamentos vecinos de Francia. Se han descargado también los datos de la red de ferrocarriles, de metro y los correspondientes a las redes de bus urbano e interurbano.

Toda esta información se ha integrado en una base de datos PostGIS con la extensión pgroute, y se ha creado un grafo completo de comunicaciones.

Se ha analizado su calidad general y se ha observado que todas las subredes eran de buena calidad excepto la de bus. Para la subred de autobús se ha editado la información original para asegurar la coherencia topológica de la subred (había muchos problemas de sentidos de marcha erróneos).

El resultado final del proceso de integración y análisis de conectividad es que la calidad es suficientemente buena en los casos de las carreteras, trenes y metro, pero en el caso de bus queda pendiente si el proyecto OSM realizará versiones más precisas.

Se han desarrollado funciones postGIS/pgroute que sirven para obtener el camino óptimo y los costes entre dos puntos (dos direcciones geocodificadas) utilizando el algoritmo Dijkstra bidireccional.

Dado que el número de cálculos a realizar son relativamente grandes (potencialmente tantos como portales diferentes) y que el cálculo es relativamente lento, se ha procedido, en primer lugar, a optimizar al máximo los datos del grafo (utilizando RTrees clusterizados con los datos y sobre todo haciendo que los cálculos se limiten a una zona rectangular lo suficientemente grande que incluya los puntos de origen y destino).

Adicionalmente se ha desarrollado una aplicación Java que realiza el cálculo de rutas en paralelo, haciendo una partición de conjunto total de orígenes/destinos. El resultado final es que el cálculo es casi tanto más rápido como el factor de partición utilizado.

Para testar los datos, su optimización y cálculo en paralelo, se procedió a calcular, municipio a municipio, el tiempo de desplazamiento de toda la población de Cataluña al hospital más cercano.

Objetivo 2: Clasificar los municipios según su grado de urbanización

Eurostat determinó y publicó una metodología para clasificar los municipios en tres categorías: ciudades grandes o áreas densamente pobladas, ciudades medias o áreas semidensas y áreas rurales o áreas de densidad de población baja. Esta metodología parte del grid estándar europeo y, a partir del cálculo de la población dentro de cada celda, se han delimitado y clasificado los municipios en cada una de las tres categorías.

Idescat ha implementado esta metodología para disponer de la clasificación de los municipios más actualizada posible (años 2018, 2019 y 2020). También se han analizado los efectos de utilizar grids de mayor precisión y se ha visto que los resultados, efectivamente, dependen de la precisión del grid. Los resultados de estos trabajos han sido objeto de ponencias en distintos congresos.

Objetivo 3: Calcular cuáles son los municipios rurales remotos

Según Eurostat un municipio es remoto cuando, además de estar localizado en un área rural de baja densidad está situado a más de 45 minutos por carretera de la ciudad grande más cercana. Se ha utilizado la red de carreteras de Open Street Maps y el software propio del Idescat para realizar el cálculo en paralelo con el objetivo de calcular la distribución de tiempo de recorrido por carretera para cada uno de los habitantes de los municipios rurales, en la ciudad más cercana. Para aquellos municipios cuya mediana del tiempo de desplazamiento es superior a los 45 minutos se ha clasificado el municipio como municipio rural remoto.

Sistema integrado de metadatos (Qualitas)

Objetivo: Mejorar el actual sistema integrado de metadatos: perfeccionamiento de la aplicación de gestión de la documentación de los metadatos de los procesos estadísticos; elaboración de nuevos informes metodológicos estandarizados en el marco del modelo GSIM (Generic Statistical Information Model) y del SDMX (Statistical Data and Metadata Exchange), y documentación de las variables asociadas a los procesos estadísticos, a cargo del Idescat.

Líneas de ámbito vertical

Encuesta de condiciones de vida (ECV)

Objetivo: Cambio metodológico relacionado con el hecho de que la muestra adicional del Idescat sigue un modelo de panel rotante con 4 turnos de rotación, esto significa que se investigarán las mismas unidades a lo largo de los 4 años. Cambio metodológico relacionado con la definición del indicador tasa AROPE que afecta a dos de sus tres componentes, concretamente a los de baja intensidad en el trabajo y de la privación material y social severa. Esta nueva definición responde a los cambios metodológicos introducidos por Eurostat para recoger los objetivos de la Agenda 2030 de la UE.

Encuesta de la financiación y el gasto de la enseñanza privada (EFDE)

Objetivo: Desarrollo de la nueva aplicación de gestión vía web para la recogida de la información de los centros educativos (universitarios y no universitarios) para la realización del trabajo de campo de la encuesta. Esta aplicación incorpora notables mejoras respecto a la anterior y permite una gestión más ágil y eficiente del seguimiento del trabajo de campo, así como incrementar el volumen de información final de la operación disponible.

Encuesta del empleo del tiempo (EET)

Objetivo: Finalización de la elaboración del proyecto técnico de la EET. Elaboración de la muestra representativa para determinadas áreas territoriales y grado de urbanización según la clasificación de Eurostat (DGURBA). Trabajos de desarrollo de la aplicación de gestión que los usuarios a encuestar tendrán que utilizar. Desarrollo de los cuestionarios electrónicos del hogar, individual y diario de actividad.

Sistema estadístico de información laboral

Objetivo: Desarrollo conceptual del sistema integrado de información estadística laboral, concebido como un ecosistema de datos que se basa en el gran potencial de los registros administrativos para generar información de calidad, pero que también está integrado por fuentes de base muestral y contempla el aprovechamiento de otras fuentes internas y externas y/o de base agregada. Asimismo, se interconecta con los registros básicos de población, entidades y territorio y sus respectivos satélites, lo que debe permitir analizar la información según diversas perspectivas. El objetivo principal es la producción eficiente y enriquecida de estadísticas relacionadas con el mercado laboral.

Desarrollo de la Estadística de comercio con el extranjero y de la Estadística de comercio con el extranjero según contenido tecnológico en la Plataforma Cerdà

Objetivo: Desarrollo de los procesos estadísticos y de estimación asociados a la Estadística de comercio con el extranjero y a la Estadística de comercio con el extranjero según contenido tecnológico utilizando el software desarrollado por la Plataforma Cerdà, y desarrollo de las tabulaciones, rankings y jerarquías de navegación de la información.

Desarrollo de la Estadística de la actividad del turismo rural en la Plataforma Cerdà

Objetivo: Desarrollo de los procesos estadísticos y de estimación asociados a la Estadística de la actividad del turismo rural utilizando el software desarrollado por la Plataforma Cerdà, y desarrollo de las tabulaciones, rankings y jerarquías de navegación de la información.

Desarrollo de sistemas de perturbación en la difusión de la Estadística del empleo asalariado y autónomo según afiliaciones a la Seguridad Social

Objetivo: Desarrollo de los procesos de perturbación en la difusión de la información como método de protección de la revelación estadística y de ampliación de la capacidad de publicación de información de variables jerárquicas.

Desarrollo de los métodos de validación de direcciones y geocodificación de la información de afiliaciones y cuentas de cotización en la Seguridad Social

Objetivo: Desarrollo de los métodos y procesos de validación de direcciones y geocodificación con el objetivo de mejorar la ubicación geográfica de la información, permitir desagregaciones territoriales de ámbito inframunicipal y clasificaciones territoriales distintas a la de los ámbitos estándar.

Indicadores de la economía circular

Objetivo: Análisis de viabilidad para la construcción y difusión de un marco de indicadores anuales de los indicadores de la economía circular para Cataluña tomando como referencia la batería de indicadores de Eurostat.

Proyecto experimental de web scraping

Objetivo: Desarrollo de un proyecto piloto experimental para evaluar la oportunidad de utilizar de forma estable el uso de la técnica del web scraping para disponer de información sobre las constituciones, modificaciones y disoluciones de empresas en Cataluña, y de sus características y ubicación de sede social, con fines estadísticos.

9.2. Revista SORT (Statistics and Operations Research Transactions)

El año 2022 es el vigésimo de la revista SORT (Statistics and Operations Research Transactions), publicación científica internacional coeditada por el Idescat y siete universidades catalanas, orientada a la investigación aplicada en el ámbito de la estadística, la investigación operativa, la bioestadística y la estadística oficial.

Desde 2007 la revista SORT está indexada en las bases de datos del Science Citation Index Expanded. En 2021 el factor de impacto se situó en 1,759.

Factor de impacto de la revista SORT. 2017–2021
Año 2021 2020 2019 2018 2017
Factor de impacto 1,759 1,185 0,778 1,125 1,344

Durante el año 2022 se han publicado los dos números del volumen 46 y se ha continuado el proceso de gestión editorial de la revista a través de la plataforma RACO (Revistas Catalanas con Acceso Abierto), en el marco del convenio con el Consorcio de Servicios Universitarios de Cataluña.

En este ejercicio, el número de artículos sometidos a revisión ha sido de 59, una cifra muy similar a la del pasado año.

Por otra parte, el número de páginas publicadas ha sido superior al del año anterior (260 páginas por 222 en 2021), con un total de diez artículos entre los dos números del volumen 46.

Números de SORT publicados en 2022
Título Fecha
Volume 46, Number 1, January–June 2022 Junio del 2022
Volume 46, Number 2, July–December 2022 Diciembre del 2022