Inscripción

Duración

Docente

SÁEZ NAVASCUÉS, Sebastián

La generación y utilización de estadísticas oficiales es fundamental para el desarrollo de políticas públicas y requiere de agentes capacitados/as en el tratamiento de datos. Por tal motivo, es importante propiciar espacios de formación y capacitación en el uso de datos oficiales dirigidos a mejorar la gestión pública, fortaleciendo el desempeño desde cada espacio de trabajo.

Desde el presente espacio se propone contribuir a la formación de los/as agentes municipales y provinciales, brindándoles herramientas metodológicas para incorporar competencias de forma tal que puedan procesar datos, interpretarlos y extraer conocimiento de estos a través de herramientas habituales como Excel.

Datos y bases de datos

 

Definición de dato. Tipos de datos: diferentes formas de clasificación según el momento del tratamiento, escala de medida, dimensión y rol en el análisis. Calidad de los datos. Tipos de bases de datos: relacional, transaccional, orientada a objetos, objeto-relacional, activas, espaciales, series de tiempo, texto, multimedia, otras. Los procesos KDD, SEMMA y CRISP y el análisis inteligente de datos.

Análisis de datos

 

Tipo de análisis de datos: descriptivo, diagnóstico, predictivo y prescriptivo. El proceso de análisis de datos: definición del problema, selección y preparación de los datos. Introducción al pre-procesamiento de los datos y sus tareas: integración, exploración, limpieza, transformación, reducción y discretización.

Visualización de datos para el pre-procesamiento

 

Integración de datos: agregación, desagregación, transposición, concatenación. Exploración de los datos: análisis univariado, exploración visual, exploración formal con estadísticos. Limpieza de datos: datos faltantes, datos con ruido y su eliminación, valores atípicos. Transformación de datos: aplicación a variables categóricas, reducción de dimensionalidades, discretización

Interpretación de gráficos

 

Tipos de gráficos y su utilidad explicativa. Selección de gráficos adecuados a los datos disponibles: análisis descriptivo, comparación de dos o más grupos, relación entre dos variables numéricas. Cuadros bivariados, tablas de doble entrada. Gráfico de sectores, Diagrama de barras. Histogramas. Diagramas de cajas. Visualización de la normalidad de los datos. Gráficos de líneas para series de tiempo. Diagramas de dispersión.

A definir