Hey, I'm Mauro!
Soy un ML Platform Engineer con 10+ años construyendo sistemas de machine learning en producción. Especializado en arquitecturas escalables y optimización de modelos para entornos de alto rendimiento.
Proyectos Destacados
Sistema de Recomendación en Tiempo Real
Event-driven procesando 10M+ eventos/día con latencia p99 < 50ms. Feature store distribuido y pipeline de reentrenamiento continuo que mejoró el CTR en 32%.
Computer Vision para Edge
Optimización de modelos usando quantization y knowledge distillation. Reducción del 90% en tamaño manteniendo 95% accuracy en 500+ dispositivos.
NLP Pipeline Multilingüe
Sistema para 12 idiomas con transformers optimizados. Mixed-precision training y model parallelism reduciendo tiempo 70%.
Escritos Recientes
Optimizando Inferencia de LLMs en Producción
Técnicas de optimización para servir modelos grandes: quantization, batching dinámico y KV caching.
De Jupyter a Producción
Metodología para transformar notebooks en pipelines de ML robustos y mantenibles.
Feature Stores: Mitos y Realidades
Análisis sobre cuándo necesitas un feature store y alternativas simples que funcionan.