Saltar al contenido principal

9. Investigación y desarrollo

Durante el año 2023 se han desarrollado varias líneas de innovación, entre las que destacan las siguientes de ámbito transversal:

  • Estadística del grado de urbanización
  • Registro estadístico de territorio
  • Sistema integrado de metadatos (Qualitas)
  • Sistemas de información geográfica

Por otra parte, el Idescat ha dedicado recursos a las siguientes líneas de innovación técnica o metodológica de carácter más vertical:

  • Desarrollo de la Estadística de comercio con el extranjero y de la Estadística de comercio con el extranjero según contenido tecnológico en la Plataforma Cerdà
  • Desarrollo de la Estadística de la actividad del turismo rural en la Plataforma Cerdà
  • Desarrollo de los métodos de validación de direcciones y geocodificación de la información de afiliaciones y cuentas de cotización en la Seguridad Social
  • Encuesta de usos lingüísticos de la población (EULP) 2023
  • Encuesta de consumos intermedios (ECI)
  • Encuesta del empleo del tiempo (EUT)
  • Indicadores de la economía circular
  • Indicadores de sostenibilidad del turismo
  • Proyecto experimental de web scraping
  • Sistema estadístico de información laboral

También se han realizado mejoras conceptuales en estadísticas económicas sectoriales, que se detallan en el apartado correspondiente.

9.1. Líneas de innovación estadística

Líneas de ámbito transversal

Estadística del grado de urbanización

Objetivo: Eurostat determinó una metodología para clasificar a los municipios en tres categorías: ciudades o áreas densamente pobladas, localidades o áreas semidensas y áreas rurales o áreas de densidad de población baja. Esta metodología parte del grid estándar europeo y, a partir del cálculo de la población dentro de cada celda, se han delimitado y clasificado las unidades territoriales de Cataluña en cada una de las tres categorías.

En 2023, el Idescat ha actualizado la estadística para los municipios del año 2021 y ha ampliado los cálculos del grado de urbanización para secciones censales y agrupaciones censales, además de incorporar nuevos indicadores del porcentaje de población residente en cada tipo de celda y la publicación de la población total incluida en la cuadrícula de 1 km2.

Registro estadístico de territorio

Objetivo: Actualización del Registro estadístico de territorio, que incluye tanto las direcciones de la población como las direcciones de las cuentas de cotización de la Tesorería General de la Seguridad Social y las direcciones de trabajo de los autónomos afiliados. Mantenimiento de la aplicación en JAVA para el tratamiento de direcciones que no se han podido codificar de forma automática. Esta aplicación utiliza Google Web Tool-kit (GWT) para desarrollar en JAVA la parte de cliente y se han utilizado herramientas de Open Layers (OL) para la visualización de las direcciones en mapas. La aplicación proporciona, para cada dirección que debe geocodificarse, una lista de direcciones del mismo municipio similares en cuanto al tipo y nombre de la vía. Al seleccionar manualmente una dirección de las candidatas, ésta se visualiza en un mapa y permite diferentes opciones (asignarla como correcta, avanzar a la siguiente sin eliminarla o asignarla como dirección no localizada). La aplicación realiza una serie de tratamientos para extraer automáticamente el tipo de vía, eliminar las partes innecesarias de la dirección o asignar el número de calle. Adicionalmente, permite asignar una dirección concreta a partir de su selección en el mapa.

Sistemas de información geográfica

Objetivo: Dentro de la actuación estadística Sistemas de información geográfica, se ha mantenido la red de transporte para encontrar caminos óptimos entre dos puntos, así como para poder calcular los costes asociados en espacio y tiempo.

Se trata de una herramienta básica para conocer la distribución de costes que tiene la población para llegar a ciertas infraestructuras. La herramienta utiliza la información disponible en el proyecto Open Street Maps (OSM). Incluye los datos de carreteras relativos al territorio de Cataluña, así como los correspondientes a Aragón y los departamentos vecinos de Francia. Se han descargado también los datos de la red de ferrocarriles, de metro y los correspondientes a las redes de bus urbano e interurbano. Esta información está integrada en una base de datos PostGIS con la extensión pgroute, que representa un grafo completo de comunicaciones.

La calidad de la red de carreteras y las redes de transporte de trenes y metro es buena. Por el contrario, la red de autobús presenta muchos problemas de calidad, con sentidos de marcha erróneos. Queda pendiente ver si el proyecto OSM realizará versiones más precisas para poder utilizar la red de autobuses.

Se han desarrollado funciones PostGIS/pgroute que sirven para obtener el camino óptimo y los costes entre dos puntos (dos direcciones geocodificadas) utilizando el algoritmo Dijkstra bidireccional. Dado que el número de cálculos a realizar puede ser relativamente grande (potencialmente tantos cálculos como portales diferentes) y que el cálculo es lento, se han optimizado al máximo los datos del grafo, por un lado utilizando RTrees clusterizados con los datos y, por otro, limitando los cálculos a una zona rectangular lo suficientemente grande que incluya los puntos de origen y destino. Adicionalmente, se ha desarrollado una aplicación Java que realiza el cálculo de rutas en paralelo, haciendo una partición de conjunto total de orígenes/destinos. El resultado final es que el cálculo es casi tanto más rápido como el factor de partición utilizado.

En 2023 se ha utilizado esta herramienta para atender una petición de asistencia técnica estadística del Departamento de Educación, de cálculo de los costes de desplazamiento en tiempo de los alumnos no universitarios, desde sus domicilios hasta los centros escolares.

Sistema integrado de metadatos (Qualitas)

Objetivo: Mejorar el actual sistema integrado de metadatos: perfeccionamiento e incorporación de mejoras en la aplicación de gestión de la documentación de los metadatos de los procesos estadísticos; elaboración de nuevos informes metodológicos estandarizados en el marco del modelo GSIM (Generic Statistical Information Model) y del SDMX (Statistical Data and Metadata Exchange), y continuación de la documentación de las variables asociadas a los procesos estadísticos, a cargo del Idescat.

Líneas de ámbito vertical

Desarrollo de la Estadística de comercio con el extranjero y de la Estadística de comercio con el extranjero según contenido tecnológico en la Plataforma Cerdà

Objetivo: Desarrollo de los procesos estadísticos y de estimación asociados a la Estadística de comercio con el extranjero y a la Estadística de comercio con el extranjero según contenido tecnológico utilizando el software desarrollado por la Plataforma Cerdà, y desarrollo de las tabulaciones, rankings y jerarquías de navegación de la información ajustadas al sistema de difusión actual.

Desarrollo de la Estadística de la actividad del turismo rural en la Plataforma Cerdà

Objetivo: Desarrollo de los procesos estadísticos y de estimación asociados a la Estadística de la actividad del turismo rural utilizando el software desarrollado por la Plataforma Cerdà, y desarrollo de los automatismos de generación y difusión del plan de tabulación para reducir las intervenciones manuales.

Desarrollo de los métodos de validación de direcciones y geocodificación de la información de afiliaciones y cuentas de cotización en la Seguridad Social

Objetivo: Desarrollo de los métodos y procesos de validación, imputación de direcciones y geocodificación con el objetivo de mejorar la ubicación geográfica de la información, permitir desagregaciones territoriales de ámbito inframunicipal y clasificaciones territoriales distintas a la de los ámbitos estándar.

Encuesta de usos lingüísticos de la población (EULP) 2023

Objetivo: Elaboración del proyecto técnico de la EULP 2023 en colaboración con la Secretaría de Política Lingüística del Departamento de Cultura de la Generalitat de Catalunya. Desarrollo de la primera fase del trabajo de campo y definición del plan de trabajo para la segunda fase, al que se han incorporado protocolos de incentivación de los hogares catalanes. Trabajos de desarrollo de la aplicación de gestión que los usuarios a encuestar tendrán que utilizar. Desarrollo de los cuestionarios en papel y electrónicos dirigidos a los hogares, de acuerdo con sus características, así como del resto de documentación metodológica.

Encuesta de consumos intermedios (ECI)

Objetivo: Elaboración del proyecto técnico del Marco input-output de Cataluña 2021, en el que se ubica la ECI como principal fuente de información. Inicio del trabajo de campo de la actuación estadística, a partir de una muestra representativa por sectores de las empresas de menos de 100 trabajadores y con carácter censal para las empresas que superen a los 100 trabajadores. Trabajos de desarrollo de la aplicación de gestión que los usuarios a encuestar tendrán que utilizar. Desarrollo de los distintos modelos de cuestionarios electrónicos dirigidos a las empresas, de acuerdo con sus características, así como del resto de documentación metodológica.

Encuesta del empleo del tiempo (EUT)

Objetivo: Finalización de la elaboración del proyecto técnico de la EUT e inicio del trabajo de campo de la actuación estadística, a partir de una muestra representativa para determinadas áreas territoriales y grado de urbanización según la clasificación de Eurostat (DEGURBA). Trabajos de desarrollo de la aplicación de gestión que los usuarios a encuestar tendrán que utilizar. Desarrollo del cuestionario del hogar, cuestionario individual y diario de actividades en papel y en formato electrónico.

Indicadores de la economía circular

Objetivo: Análisis de viabilidad, dificultades y limitaciones para la construcción y difusión de un marco de indicadores anuales de los indicadores de la economía circular para Cataluña tomando como referencia la batería de indicadores de Eurostat, a raíz de la revisión y aplicación establecida por la Comisión Europea y publicada en mayo de 2023.

Indicadores de sostenibilidad del turismo

Objetivo: Desarrollo de un conjunto de indicadores para medir y monitorizar la sostenibilidad del turismo, llevado a cabo en el marco de un proyecto de colaboración con la OCDE, la Unión Europea y 4 regiones (Andalucía, Cataluña, Comunidad Valenciana y Navarra). Este sistema de indicadores cubre áreas relevantes de la gestión de la sostenibilidad del turismo, tales como los beneficios económicos, el empleo, la estacionalidad, la accesibilidad, la presión, la satisfacción de los turistas y residentes, la gestión ambiental y la gestión del agua, la energía y los residuos. La definición del sistema de indicadores, que debe basarse en las recomendaciones metodológicas de las principales organizaciones internacionales con responsabilidades en la elaboración y producción de estadísticas e indicadores del sector turístico, en concreto, la OMT, la OCDE y Eurostat, se perfeccionará en una fase piloto posterior.

Proyecto experimental de web scraping

Objetivo: Desarrollo de un proyecto piloto experimental para evaluar la oportunidad de utilizar de forma estable el uso de la técnica del web scraping para disponer de información sobre las constituciones, modificaciones y disoluciones de empresas en Cataluña, y de sus características y ubicación de sede social, con fines estadísticos, que permita enriquecer el Directorio de empresas y establecimientos, el Registro estadístico de entidades y el Sistema de información estadística laboral.

Sistema estadístico de información laboral

Objetivo: Desarrollo conceptual del sistema integrado de información estadística laboral, concebido como un ecosistema de datos que se basa en el gran potencial de los registros administrativos para generar información de calidad, pero que también está integrado por fuentes de base muestral y contempla el aprovechamiento de otras fuentes internas y externas y/o de base agregada. Asimismo, se interconecta con los registros básicos de población, entidades y territorio y sus respectivos satélites, lo que debe permitir analizar la información según diversas perspectivas. El objetivo principal es la producción eficiente y enriquecida de estadísticas relacionadas con el mercado laboral. En 2023 se han llevado a cabo trabajos metodológicos para la elaboración de estadísticas de demografía empresarial a partir de varias fuentes disponibles.

9.2. Revista SORT (Statistics and Operations Research Transactions)

El año 2023 es el vigésimo primero de la revista SORT (Statistics and Operations Research Transactions), publicación científica internacional coeditada por el Idescat y siete universidades catalanas, orientada a la investigación aplicada en el ámbito de la estadística, la investigación operativa, la bioestadística y la estadística oficial.

Desde 2007 la revista SORT está indexada en las bases de datos del Science Citation Index Expanded. En 2022 el factor de impacto se situó en 1,6.

Factor de impacto de la revista SORT. 2018–2022
Año 2022 2021 2020 2019 2018
Factor de impacto 1,6 1,759 1,185 0,778 1,125

Durante el año 2023 se han publicado los dos números del volumen 47 y se ha seguido el proceso de gestión editorial de la revista a través de la plataforma RACO (Revistas Catalanas con Acceso Abierto), en el marco del convenio con el Consorci de Servicios Universitarios de Cataluña. El número dos del volumen 47 se ha dedicado al 9º International Workshop on Compositional Data Analysis (CoDaWork, 2022), y se han incluido siete artículos de este congreso.

En este ejercicio, el número de artículos sometidos a revisión ha sido de 58, una cifra muy similar a la del pasado año.

Por otra parte, el número de páginas publicadas ha sido muy superior al del año anterior (360 páginas por 260 en 2022), con un total de doce artículos entre los dos números del volumen 47.

Números de SORT publicados en 2023
Título Fecha
Volume 47, Number 1, January–June 2023 Junio de 2023
Volume 47, Number 2, July–December 2023 Diciembre de 2023