🚀 DATAMECUM Webinar 🚀 LLMs que Aprenden: Reinforcement Learning en IA Generativa

Автор: Datamecum

Загружено: 2026-01-14

Просмотров: 117

Описание: 📅 El miércoles 13 de enero de 2026 aprendimos con Inés Esteve cómo el Reinforcement Learning convierte modelos estáticos en sistemas adaptativos capaces de aprender del entorno, de la retroalimentación humana y de sus propias acciones 🚀

RECURSOS
Contacto
ines.esteve.mompo‪@gmail.com‬
www.linkedin.com/in/ines-esteve-mompo
Para profundizar
Presentación de Inés https://bit.ly/4qUiIc3
Libro+charlas+artículos del autor-RL an introduction, Richard S.Sutton http://incompleteideas.net/
Libro+charlas+artículos del autor- RL from human feedback, Nathan Lambert https://rlhfbook.com/
Libro-Brains, Machines, and Mathematics, Michael A. Arbib https://link.springer.com/book/10.100...
Recursos Deep RL Univ. Carnagie Mellon https://www.andrew.cmu.edu/course/10-...
Artículo, Attention is all you need https://arxiv.org/abs/1706.03762
Artículo, Self-rewarding language models https://arxiv.org/abs/2401.10020

TIMELINE
00:00 Presentación de Inés y del Programa Experto en Data Science Datamecum (inicio 23 de enero)
06:20 Fundamentos de los Modelos de Lenguaje. Transformers.
08:40 Clasificación según entrenamiento: Pre-entrenamiento y Fine-Tuning
10:10 Fundamentos del Aprendizaje por Refuerzo.
13:20 RL y LLM: RL from human feedback
19:05 RL from AI feedback
21:50 Self-rewarding language models
25:10 Por qué los LLM no aprenden en tiempo real y 3 posibles soluciones alternativas: RL en bases de datos, memoria contextual dinámica y optimización de prompt dinámico.
34:10 Conclusiones. Preguntas y respuestas de los asistentes

********** ********* ********** ********* ********** *********
🚀 Formarse en inteligencia artificial ya no es opcional: es la única manera de no quedarse fuera y en Datamecum te lo ponemos muy fácil: formación online en directo que se graba, contenidos 100% prácticos, docentes expertos y un precio mínimo con una calidad máxima ¡aún estás a tiempo! www.datamecum.com

✅ 𝟴ª 𝗲𝗱. 𝗘𝗫𝗣𝗘𝗥𝗧𝗢 𝗘𝗡 𝗗𝗔𝗧𝗔 𝗦𝗖𝗜𝗘𝗡𝗖𝗘 (𝟮𝟯 𝗲𝗻𝗲𝗿𝗼-𝟮𝟱 𝗷𝘂𝗹𝗶𝗼 𝟮𝟬𝟮𝟲)
https://datamecum.com/programa-expert...
𝟭𝟬𝟬% 𝗴𝗿𝗮𝘁𝘂𝗶𝘁𝗼 𝗰𝗼𝗻 𝗯𝗼𝗻𝗶𝗳𝗶𝗰𝗮𝗰𝗶ó𝗻 𝗙𝗨𝗡𝗗𝗔𝗘
1.495€
200h. clases online 𝗲𝗻 𝗱𝗶𝗿𝗲𝗰𝘁𝗼 que se graban viernes tarde y sábados mañana
𝘚𝘪𝘯 𝘤𝘰𝘯𝘰𝘤𝘪𝘮𝘪𝘦𝘯𝘵𝘰𝘴 𝘱𝘳𝘦𝘷𝘪𝘰𝘴.
𝘼𝙥𝙤𝙮𝙖𝙙𝙤 𝙘𝙤𝙣 𝙝𝙚𝙧𝙧𝙖𝙢𝙞𝙚𝙣𝙩𝙖𝙨 𝙙𝙚 𝙄𝘼 𝙂𝙚𝙣𝙚𝙧𝙖𝙩𝙞𝙫𝙖.

👉 [[email protected]] ¡escríbenos!
📞 613.08.30.04 Whatsapp o llamada tradicional

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

🚀 DATAMECUM Webinar 🚀 LLMs que Aprenden: Reinforcement Learning en IA Generativa

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

🚀 DATAMECUM Webinar 🚀 Clasificadores autoexplicativos LLM y Autoencoders dispersos con Diego Bonilla

🚀 DATAMECUM Webinar 🚀 Clasificadores autoexplicativos LLM y Autoencoders dispersos con Diego Bonilla

🚀 DATAMECUM Webinar 🚀 Tus decisiones, Su recompensa. Otro lado de la IA agéntica con Andrea Bonetti

🚀 DATAMECUM Webinar 🚀 Tus decisiones, Su recompensa. Otro lado de la IA agéntica con Andrea Bonetti

Análisis Predictivo con ML en Medicina Regenerativa

Análisis Predictivo con ML en Medicina Regenerativa

Изменения мнения. Фактчекинг как инструмент цензуры / УР 21.01

Изменения мнения. Фактчекинг как инструмент цензуры / УР 21.01

🚀 DATAMECUM Webinar 🚀 De la Comprensión (NLU) a la Ejecución con Agentic IA por María Ballesteros

🚀 DATAMECUM Webinar 🚀 De la Comprensión (NLU) a la Ejecución con Agentic IA por María Ballesteros

The Day After AGI

The Day After AGI

Как живут в Гренландии: Быт, нравы, колония Дании и угроза захвата США. Рассказ жены эскимоса

Как живут в Гренландии: Быт, нравы, колония Дании и угроза захвата США. Рассказ жены эскимоса

🚀 DATAMECUM Webinar 🚀 ¡ADIOS CAOS! IA para automatizar TU eMAIL con Andrés Espinosa

🚀 DATAMECUM Webinar 🚀 ¡ADIOS CAOS! IA para automatizar TU eMAIL con Andrés Espinosa

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Davos LIVE: Canadian PM Mark Carney speaks at World Economic Forum

Davos LIVE: Canadian PM Mark Carney speaks at World Economic Forum

Soy Docente: LA MEJOR INTELIGENCIA ARTIFICIAL PARA NO TENER CARGA ADMINISTRATIVA: NOTEBOOKLM

Soy Docente: LA MEJOR INTELIGENCIA ARTIFICIAL PARA NO TENER CARGA ADMINISTRATIVA: NOTEBOOKLM

Экспресс-курс RAG для начинающих

Экспресс-курс RAG для начинающих

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Открытие Варбурга: 4 переключателя, которые мешают раку расти | Здоровье с Доктором

Открытие Варбурга: 4 переключателя, которые мешают раку расти | Здоровье с Доктором

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

¿Qué es un LLM? Enormes Modelos del Lenguaje | Large Language Models

¿Qué es un LLM? Enormes Modelos del Lenguaje | Large Language Models

🚀 DATAMECUM Webinar 🚀 DATOS para predecir resistencias antimicrobianas

🚀 DATAMECUM Webinar 🚀 DATOS para predecir resistencias antimicrobianas

La inteligencia artificial y la educación | Sang Gunn Yoo Park | TEDxUISRAEL

La inteligencia artificial y la educación | Sang Gunn Yoo Park | TEDxUISRAEL

Tutorial de inteligencia artificial para cualquier persona

Tutorial de inteligencia artificial para cualquier persona