Profesor: Julio Waissman Vilanova (julio.waissman@unison.mx)
Horarios:
- Martes de 18:00 a 20:00 hrs
- Sábados de 10:00 a 12:00
- Jueves, 3 horas autónomas
Lugar: Lab. en Ciencia de Datos, edificio 3K-1
Temario
- Introducción
- Motivación y presentación
- Uso de herramientas para Ciencia de Datos
- Ingesta de datos
- Lectura de formatos
csv
,json
,xml
,sql
- Uso de API’s para adquirir información
- Calidad del datos
- Lectura de formatos
- Análisis exploratorio de Datos
- Tipos de datos y su procesamiento básico
- Combinando tablas de datos
- Herramientas para EDA
- Librerías de visualización
- Agregación
- Limpieza de datos
- Valores faltantes e imputación de datos
- Detección de anomalías
- Análisis en componentes principales
- Aprendizaje en variedades para visualización
- Ingeniería de características
- Datos numéricos y cualitativos
- Cadenas de caracteres
- Series de tiempo y variables de calendario
- Variables georeferenciadas
- Selección de características
- Generación de características
- Contando historias con datos
- Principios básicos de visualización
- Indicadores claves de desempeño
- Contando historias con datos
- Herramientas para el desarrollo de tableros de visualización
Herramientas de enseñanza
Vamos a utilizar DataCamp for the Classroom este semestre. DataCamp apoya la educación alrededor del muno con esta iniciativa libre. Puedes encontrar más información al respecto en datacamp.com/groups/education.
DataCamp es una plataforma intuitiva para el aprendizaje de competencias para ciencia de datos. DataCamp cuenta con cursos, proyectos, tutoriales y rutas de aprendizaje para aprender desde los conceptos básicos hasta los temas avanzados de ciencia de datos usando R, python y SQL. DataCamp ofrece 350+ cursos por instructores expertos en tópicos como importación de datos, visualización y aprendizaje automático entre otros.