Agentes IA en producción: por qué fallan y cómo evitarlo
Автор: Felipe Florez
Загружено: 2026-03-15
Просмотров: 30
Описание:
Por qué tus agentes AI fallan en producción y cómo evaluarlos de verdad.
La mayoría de AI Engineers prueban sus agentes con 3 preguntas en el chat y dicen “funciona”. Luego llega producción y todo explota. Eso se llama Vibe Testing, y es la razón por la que tus proyectos no escalan.
Este video aborda las alucinaciones en los modelos de lenguaje grandes (LLM) en producción, presentando el Evaluation Driven Development (EDD) como una solución clave. Se explica cómo la auditoría de razonamiento y métricas de contexto mejoran los sistemas productivos. Para el AI Engineer, dominar estos conceptos es crucial para llevar la artificial intelligence a producción de manera efectiva.
En este video te muestro el Evaluation-Driven Development (EDD): el enfoque que usan los equipos que sí llevan agentes a producción, usando LLM-as-a-Judge para detectar alucinaciones automáticamente antes de que lleguen al usuario.
Lo que aprenderás:
→ Por qué el testing tradicional no funciona con LLMs
→ Cómo construir un Golden Dataset para tu negocio
→ Cómo usar LLM-as-a-Judge para auditar respuestas automáticamente
→ Cómo integrar métricas de evaluación en tu CI/CD
💬 ¿Quieres mentoría 1:1 sobre AI Engineering? Escríbeme: / andres-felipe-florez-gil
🔔 Suscríbete para contenido de AI Engineering en español cada semana.
#AIEngineering #AgentesIA #InteligenciaArtificial #PythonIA #FelipeFlorezIA
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: