Ingeniería de características

Curso Ingeniería de Características

Datos numéricos y cualitativos

  1. Engineering Numeric Predictors

  2. Normalización y estandarización de datos numéricos

  3. Algunas transformaciones en variables numéricas a considerar (sci-kit learn guide)

  4. Un ejemplo en sci-kit learn de diferentes métodos de escalamiento

  5. All about Categorical Variable Encoding

  6. Encoding Categorical Predictors

  7. Biblioteca de python categorical_encoding de Alteryx

  8. Libreta para colab con sklearn y otra libreta para colab con una librería especializada.

  9. A Data Scientist’s Toolkit to Encode Categorical Variables to Numeric

Cadenas de caracteres

  1. Vectores de palabras

  2. Una presentación con más detalle

Variables georeferenciadas

  1. Una presentación muy agradable sobre el análisis de datos geoespaciales en python con herramientas libres.

  2. Curso Geographic Data Science de Dani Arribas-Bel. Tiene ejemplos en librets de python y presentaciones muy interesantes y accesibles.

  3. Material del curso de geoinformática del Laboratorio Nacional de Geointeligencia (GeoInt) de CentroGeo.

Series de tiempo y variables de calendario

  1. La documentación de pandaspara fechas y horas vuelta una libreta de jupyter

  2. Un tutorial bastante completo en Kaggle de series de tiempo

  3. Suavizado por medias móviles, filtro exponencial y Holt-Winters y Suavizado local y en particular LOESS

  4. Un ejemplito sobre suavizado en python

Agregación

  1. Operadores de agregación, visto de un punto de vista muy formal.
  2. Operadores de centro segun wikipedia
  3. Operadores de agregación OWA.
  4. Operadores del tipo disyunción y conjunción.
  5. Agregación basada en medidas de dispersión.
  6. Agregación en uno y múltiples indices en R y en python.

Selección de características

  1. A Literature Review of Feature Selection Techniques and Applications
  2. Permutation Importance en sci-kit learn.
  3. Selección de características en caret.

Generación de características

  1. Featuretools. Herramienta para generación automática de atributos en función de la naturaleza de los atributos originales y una libreta de ejemplo que me copié de la documentación.