Curso Ingeniería de Características

Maestría en Ciencia de Datos, Universidad de Sonora

Profesor: Julio Waissman Vilanova (julio.waissman@unison.mx)

Horarios:

  • Martes de 18:00 a 20:00 hrs
  • Sábados de 10:00 a 12:00
  • Jueves, 3 horas autónomas

Lugar: Lab. en Ciencia de Datos, edificio 3K-1

Temario

  1. Introducción
    1. Motivación y presentación
    2. Uso de herramientas para Ciencia de Datos
  2. Ingesta de datos
    1. Lectura de formatos csv, json, xml, sql
    2. Uso de API’s para adquirir información
    3. Calidad del datos
  3. Análisis exploratorio de Datos
    1. Tipos de datos y su procesamiento básico
    2. Combinando tablas de datos
    3. Herramientas para EDA
    4. Librerías de visualización
    5. Agregación
  4. Limpieza de datos
    1. Valores faltantes e imputación de datos
    2. Detección de anomalías
    3. Análisis en componentes principales
    4. Aprendizaje en variedades para visualización
  5. Ingeniería de características
    1. Datos numéricos y cualitativos
    2. Cadenas de caracteres
    3. Series de tiempo y variables de calendario
    4. Variables georeferenciadas
    5. Selección de características
    6. Generación de características
  6. Contando historias con datos
    1. Principios básicos de visualización
    2. Indicadores claves de desempeño
    3. Contando historias con datos
    4. Herramientas para el desarrollo de tableros de visualización

Herramientas de enseñanza

Vamos a utilizar DataCamp for the Classroom este semestre. DataCamp apoya la educación alrededor del muno con esta iniciativa libre. Puedes encontrar más información al respecto en datacamp.com/groups/education.

DataCamp

DataCamp es una plataforma intuitiva para el aprendizaje de competencias para ciencia de datos. DataCamp cuenta con cursos, proyectos, tutoriales y rutas de aprendizaje para aprender desde los conceptos básicos hasta los temas avanzados de ciencia de datos usando R, python y SQL. DataCamp ofrece 350+ cursos por instructores expertos en tópicos como importación de datos, visualización y aprendizaje automático entre otros.