Análisis exploratorio de datos

Curso Ingeniería de Características

Tipos de datos

Variables cualitativas

  1. Codificando variables categóricas en python, y una muy breve libretita.

Fechas y horas

  1. ¿Que es UTC? ¿Y el formato POSIX?.
  2. How To Manipulate Date And Time In Python Like A Boss
  3. Working with datetime in Pandas DataFrame
  4. Una libretita que es copia de la guía de uso de fechas de pandas

Series de tiempo

  1. Un capitulo sobre una Intoducción a las series de tiempo.
  2. Libreta de colab Working with Time Series, como parte del libro en linea Python Data Science Handbook

Manejo de cadenas de caracteres

  1. Working with text data (pandas)
  2. Libreta de colab Vectorized String Operations, como parte del libro en linea Python Data Science Handbook
  3. Regex 101 (para armar expresiones regulares)
  4. Regex tutorial — A quick cheatsheet by examples
  5. NLP avanzado con SpaCy (curso)
  6. Nubes de palabras en python y una libreta con un ejemplo que hicimos para integrar spacy con word_cloud

Información georeferenciada

  1. Geopandas y una presentacioncita.
  2. Una libreta de uso de geopandas copiada directamente del Material del curso de geoinformática.
  3. Archivos geojson, archivos Shape
  4. Para visualizar, lo más usado es la biblioteca Leaflet y su interface para python.
  5. Una libreta para hacer mapas en python usando folium.

Combinando tablas de datos

  1. Combinación de dataframes en python
  2. Expansión en columnas o renglones en python
  3. Coeficientes de correlación de Pearson, Spearman, Kendall y (\Phi_k) (con un ejemplito de como usarla).
  4. Hay que tener cuidad, correlación no significa causación como lo muestran estas spurious correlations.

Análisis exploratorio de datos

  1. Motivación: ¿Porque las solas estadísticas descriptivas no son suficientes y un análisis exploratorio de datos siempre es necesario?

  2. EDA ¿Qué es?

  3. Esta entrada de Medium con 5 herramientas de EDA automatizado y esta otra, con algunas repetidas entre las que destacan:
  4. Un ejemplito del uso de los AutoEDAs

Librerías para visualización de datos:

  1. Exclusivas de python: matplotlib, seaborn y holoviz
  2. General: librerías abiertas de plotly