Tipos de datos
Variables cualitativas
Fechas y horas
- ¿Que es UTC? ¿Y el formato POSIX?.
- How To Manipulate Date And Time In Python Like A Boss
- Working with datetime in Pandas DataFrame
- Una libretita que es copia de la guía de uso de fechas de pandas
Series de tiempo
- Un capitulo sobre una Intoducción a las series de tiempo.
- Libreta de colab Working with Time Series, como parte del libro en linea Python Data Science Handbook
Manejo de cadenas de caracteres
- Working with text data (pandas)
- Libreta de colab Vectorized String Operations, como parte del libro en linea Python Data Science Handbook
- Regex 101 (para armar expresiones regulares)
- Regex tutorial — A quick cheatsheet by examples
- NLP avanzado con SpaCy (curso)
- Nubes de palabras en python y una libreta con un ejemplo que hicimos para integrar
spacy
conword_cloud
Información georeferenciada
- Geopandas y una presentacioncita.
- Una libreta de uso de geopandas copiada directamente del Material del curso de geoinformática.
- Archivos geojson, archivos Shape
- Para visualizar, lo más usado es la biblioteca Leaflet y su interface para python.
- Una libreta para hacer mapas en python usando folium.
Combinando tablas de datos
- Combinación de dataframes en python
- Expansión en columnas o renglones en python
- Coeficientes de correlación de Pearson, Spearman, Kendall y (\Phi_k) (con un ejemplito de como usarla).
- Hay que tener cuidad, correlación no significa causación como lo muestran estas spurious correlations.
Análisis exploratorio de datos
- Esta entrada de Medium con 5 herramientas de EDA automatizado y esta otra, con algunas repetidas entre las que destacan:
- Un ejemplito del uso de los AutoEDAs
Librerías para visualización de datos:
- Exclusivas de python:
matplotlib
,seaborn
yholoviz
- General: librerías abiertas de
plotly