Fine-Tuning Language Models with Reinforcement Learning with Michael Albada

Автор: O'Reilly

Загружено: 2026-01-23

Просмотров: 214

Описание: Watch the entire Superstream: https://learning.oreilly.com/videos/a...

Building reliable AI systems means going beyond prompt engineering. In this AI Superstream session, Microsoft's Michael Albada explores how fine-tuning language models with reinforcement learning can deliver greater accuracy, control, and cost efficiency. You'll see how open weight models are closing the gap with proprietary options and how new techniques like low-rank adaptation (LoRA) make fine-tuning more practical than ever.

Michael also breaks down when fine-tuning is the right choice compared to RAG or off-the-shelf APIs. Using the Glaive Function Calling dataset, he demonstrates how reinforcement learning with verifiable rewards can shape model behavior, improve structured outputs, and support real-world use cases that demand reliability and domain-specific performance.

Follow O'Reilly on:
LinkedIn:   / oreilly
Facebook:   / oreilly
Instagram:   / oreillymedia
BlueSky: https://bsky.app/profile/oreilly.bsky...

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Fine-Tuning Language Models with Reinforcement Learning with Michael Albada

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

LLMOps Patterns for Robust Agentic System Development with Aurimas Griciūnas

LLMOps Patterns for Robust Agentic System Development with Aurimas Griciūnas

AI Engineering Antipatterns with Chip Huyen

AI Engineering Antipatterns with Chip Huyen

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Ex-OpenAI Scientist WARNS:

Ex-OpenAI Scientist WARNS: "You Have No Idea What's Coming"

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Ян Лекун: Мы не достигнем AGI, масштабируя LLMS

Ян Лекун: Мы не достигнем AGI, масштабируя LLMS

Sci-Fi Fantasy Short Film:

Sci-Fi Fantasy Short Film: "Résistance" | DUST

Уральские пельмени. Мир в котором нет алкоголя!

Уральские пельмени. Мир в котором нет алкоголя!

«Мы на дне уже»? Что ждет Россию в 2026 | Наталья Зубаревич о серьезных проблемах экономики и людей

«Мы на дне уже»? Что ждет Россию в 2026 | Наталья Зубаревич о серьезных проблемах экономики и людей

Why Light Speed Is The LIMIT? What Feynman Uncovered Will COLLAPSE Your Mind

Why Light Speed Is The LIMIT? What Feynman Uncovered Will COLLAPSE Your Mind

БЕЛКОВСКИЙ: "А царь-то не настоящий". Где Путин нашел "отца", МИРА (не)ждите, Трамп, Кадыров, Иран

AI-ассистент помнит ВСЁ — Second Brain сделал меня суперчеловеком

AI-ассистент помнит ВСЁ — Second Brain сделал меня суперчеловеком

Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу.

Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу.

«Сыграй На Пианино — Я Женюсь!» — Смеялся Миллиардер… Пока Еврейка Не Показала Свой Дар

«Сыграй На Пианино — Я Женюсь!» — Смеялся Миллиардер… Пока Еврейка Не Показала Свой Дар

Новая ИИ OpenAI ЛОМАЕТ НАУЧНЫЙ МИР! PRISM Шокировала Учёных! Google ОБРУШИЛ Цены на ИИ! Новая Gemini

Новая ИИ OpenAI ЛОМАЕТ НАУЧНЫЙ МИР! PRISM Шокировала Учёных! Google ОБРУШИЛ Цены на ИИ! Новая Gemini

Чудовищные потери российской армии. Шпионы Путина на переговорах. Оппозиция в ПАСЕ напугала Кремль

Чудовищные потери российской армии. Шпионы Путина на переговорах. Оппозиция в ПАСЕ напугала Кремль

The Agentic Fallacy: Fixing AI's Data Foundation with David Aronchick

The Agentic Fallacy: Fixing AI's Data Foundation with David Aronchick

Екатерина Шульман: Если ФСБ извинится за ПАСЕ, приду на канал к Юлии Латыниной

Екатерина Шульман: Если ФСБ извинится за ПАСЕ, приду на канал к Юлии Латыниной

Мне 73. Я жалею, что понял это только сейчас.

Мне 73. Я жалею, что понял это только сейчас.

Выступление Сергея Караганова на Зиновьевских чтениях — 2026

Выступление Сергея Караганова на Зиновьевских чтениях — 2026