Análisis de las estadísticas provinciales :servicios y operaciones estadísticas 2021-2023
Archivos
Fecha
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad de Buenos Aires. Facultad de Ciencias Económicas. Escuela de Negocios y Administración Pública
Resumen
En este estudio se analizan las características de las estadísticas provinciales oficiales en Argentina, combinando métodos exploratorios y predictivos. El problema principal la disparidad en el desarrollo estadístico y la ausencia de un análisis profundo a nivel subnacional. El objetivo es analizar, clasificar y caracterizar las provincias, los servicios y las operaciones estadísticas provinciales, identificar patrones de producción mediante criterios de calidad lo que permitirá fortalecer la planificación y gestión pública. La investigación utiliza datos provinciales recolectadas por el INDEC y las Direcciones Provinciales de Estadística entre 2021-2023, disponibles en la página del organismo. Se elaboraron tres bases con distinta unidad de análisis a estudiar, provincias, servicios estadísticos y operaciones estadísticas. Estas bases contienen variables relevantes como número de operaciones estadísticas, fuentes, regularidad, desagregación geográfica y la difusión pública, entre otras. Se aplicaron métodos multivariados (análisis de clúster, MANOVA y componentes principales) y técnicas predictivas de clasificación utilizando métodos de aprendizaje supervisado (Decision Tree, validación cruzada y Random Forest) y enfoques no paramétricos (KNN), evaluando el desempeño de estos modelos. El diagnóstico revela diversidad en la capacidad productiva provincial. Se identificaron dos clusters principales: provincias con infraestructura estadística más desarrollada y otras con limitaciones. El MANOVA confirmó diferencias significativas. Para los servicios estadísticos también se diferenciaron dos grupos según capacidad productiva e institucionalidad, el análisis de componentes principales redujo la dimensionalidad a tres componentes que explican el 74% de la variabilidad, identificando las variables que más contribuyen en cada componente. En cuanto a las operaciones estadísticas, se abordó la predicción de la difusión pública, indicador clave de calidad. El modelo Decisión Tree tuvo mejor performance (exactitud superior al 99%) para predecir si la operación será publicada o no, identificando como variables más influyentes la existencia de página web, la periodicidad, la participación de otros organismos y la regularidad de recolección, resultados ratificados con el método SHAP. En conjunto, los hallazgos ofrecen una visión integral de los factores que inciden en la producción y difusión de estadísticas oficiales, proporcionando herramientas para optimizar la gestión y articulación en la planificación estadística provincial. Finalmente, se presentan propuestas sobre los datos que fortalecerá los resultados de futuros análisis.
Descripción
Fil: Espinoza, Nora. Universidad de Buenos Aires. Facultad de Ciencias Económicas. Buenos Aires, Argentina.
Fil: Vitale, Blanca Rosa. Universidad de Buenos Aires. Facultad de Ciencias Económicas. Buenos Aires, Argentina.
Fil: Vitale, Blanca Rosa. Universidad de Buenos Aires. Facultad de Ciencias Económicas. Buenos Aires, Argentina.
Palabras clave
Operación estadística, Métodos predictivos, Análisis multivariado, Servicio estadístico, Provincias
