Hey, I'm Mauro!

Soy un ML Platform Engineer con 10+ años construyendo sistemas de machine learning en producción. Especializado en arquitecturas escalables y optimización de modelos para entornos de alto rendimiento.

Actualmente liderando MLOps donde reduje los tiempos de inferencia en 85% y los costos de infraestructura en 40% mediante optimización de modelos.

Proyectos Destacados

Sistema de Recomendación en Tiempo Real

Event-driven procesando 10M+ eventos/día con latencia p99 < 50ms. Feature store distribuido y pipeline de reentrenamiento continuo que mejoró el CTR en 32%.

PyTorch Kubernetes Kafka Redis

Computer Vision para Edge

Optimización de modelos usando quantization y knowledge distillation. Reducción del 90% en tamaño manteniendo 95% accuracy en 500+ dispositivos.

TensorFlow Lite ONNX C++

NLP Pipeline Multilingüe

Sistema para 12 idiomas con transformers optimizados. Mixed-precision training y model parallelism reduciendo tiempo 70%.

Transformers JAX Ray

Escritos Recientes

Optimizando Inferencia de LLMs en Producción

Técnicas de optimización para servir modelos grandes: quantization, batching dinámico y KV caching.

De Jupyter a Producción

Metodología para transformar notebooks en pipelines de ML robustos y mantenibles.

Feature Stores: Mitos y Realidades

Análisis sobre cuándo necesitas un feature store y alternativas simples que funcionan.