Datos numéricos y cualitativos
-
Algunas transformaciones en variables numéricas a considerar (
sci-kit learn
guide) -
Un ejemplo en
sci-kit learn
de diferentes métodos de escalamiento -
Biblioteca de python
categorical_encoding
de Alteryx -
Libreta para colab con sklearn y otra libreta para colab con una librería especializada.
-
A Data Scientist’s Toolkit to Encode Categorical Variables to Numeric
Cadenas de caracteres
Variables georeferenciadas
-
Una presentación muy agradable sobre el análisis de datos geoespaciales en python con herramientas libres.
-
Curso Geographic Data Science de Dani Arribas-Bel. Tiene ejemplos en librets de python y presentaciones muy interesantes y accesibles.
-
Material del curso de geoinformática del Laboratorio Nacional de Geointeligencia (GeoInt) de CentroGeo.
Series de tiempo y variables de calendario
-
La documentación de
pandas
para fechas y horas vuelta una libreta de jupyter -
Suavizado por medias móviles, filtro exponencial y Holt-Winters y Suavizado local y en particular LOESS
Agregación
- Operadores de agregación, visto de un punto de vista muy formal.
- Operadores de centro segun wikipedia
- Operadores de agregación OWA.
- Operadores del tipo disyunción y conjunción.
- Agregación basada en medidas de dispersión.
- Agregación en uno y múltiples indices en R y en python.
Selección de características
- A Literature Review of Feature Selection Techniques and Applications
- Permutation Importance en
sci-kit learn
. - Selección de características en
caret
.
Generación de características
- Featuretools. Herramienta para generación automática de atributos en función de la naturaleza de los atributos originales y una libreta de ejemplo que me copié de la documentación.