Operaciones de aprendizaje máquina (MLOps)

Presentaciones

Empecemos por esta presentación general.
Una presentacion de mlflow con los conceptos básicos.
Introducción a las MLOps
Preprocesamiento de datos
Selección de modelos de ML
Despliegue de modelos de ML
Monitoreo de la calidad de los modelo
Una presentación de Weights and Biases
Infraestructura y plataformas
Tutorial Explaining Machine Learning Predictions: State-of-the-art, Challenges, and Opportunities presentado en NeurIPS 2020

Libretas, scripts y tutoriales

Un ejemplo en github para usar DagsHub para manejar proyectos colaborativos con MLFlow (El repositorio también se puede revisar en su sincronización en DagsHub y su MLFlow Tracking Dashboard).
Otro ejemplito en DagsHub con mlflow.
Cookiecutter Data Science. Un esquema lógico y sencillo para plantear proyectos de ciencia de datos en python en forma genñerica.
Un curso de DVC para usar DVC en todas sus etapas.
Made with ML. Un curso muy interesante con una prespectiva industrial del aprendizaje automático. Mucho le dedica a las MLOps.
Ejemplo de uso de Ray Serve para desplegar modelos
Ejemplo de uso de Evidently para monitorear los datos

Herramientas para MLOps

MLFlow. La plataforma de código abierto más usada como base para esquemas de MLOps. Una versión simple de lo que puedes tener con DataBricks si estás en una compañía que esté dispuesta a pagar el precio. Existe una versión para experimentación.
DVC. Originalmente para versionado de datos, aunque ya hacen un poco de todo. Es mejor combinarlo con mlflow, si no se quiere pasar a un contenedor con deltalake.
Weights & Biases. Similar a DataBricks, la solucion completa. Existe una versión académica y una personal, pero no puede usarse en empresas.
MLRun. Otra plataforma similar a MLFlow pero incluye una interfase gráfica para el manejo del ciclo de vida (como DataBricks). Puede instalarse on premise.
[Neptune.ai](https://neptune.ai). Otra plataforma más, en la nube la orquestación, pero los modelos se pueden ejecutar *on premise.
Ray. Una plataforma de desarrollo pensando en la escalabilidad sobre todo. EN particular es muy apreciada la librería ray serve para poner los modelos de aprendizaje en producción.
MetaFlow. La solución de Netflix para MLOps. Al parecer muy poderoso pero tambien muy complicado de instalar on premise. Funciona sobre Kubernetes.
Facets. Otra herramienta de EDA, muy importante saber las estadísticas básicas de los datos para poder monitorearlos con pydantic o Great Expectations.
pydantic. Validación de datos conforme los utiliza uno, exclusivo par python. Similar pero para funcionar en la nube y en producción existe el proyecto Great Expectations.
Evidently AI. Herramientas en código abierto para monitorear la calidad de los datos, la deriva de los datos y la calidad de los modelos de predicción durante la etapa de producción. Se puede integrar a MLFlow, pero están más bonitos los tableros de Evidently.
Whylogs. Similar a Evidently al parecer, pero solo la librería, ya que es el corazón de un producto que ya no es de código abierto (Whylabs).
AirFlow. No es propiamente para MLOps, pero se utiliza mucho en conjunto con otras plataformas.

Otra información

CS 329S: Machine Learning Systems Design. Curso de Chip Huyen, quien (además de escribir novelas en vietnamita) tiene posiblemente el mejor curso sobre MLOps que conozco hasta el momento. Muchas de las presentaciones de curso son extractos de las presentaciones de ella (con el reconocimiento respectivo), sólo porque no tenemos tiempo para ver la versión completa que es buenísima.
Libro Interpretable Machine Learning: A Guide for Making Black Box Models Explainable, un libro del 2023 sobre el tema.