Как кнут и пряник влияют на обучение с подкреплением в ИИ // Татьяна Ким
Автор: Фестиваль науки
Загружено: 2026-02-24
Просмотров: 7
Описание:
Как ИИ учится ходить, играть и побеждать людей? Лекция объясняет метод обучение с подкреплением, на котором работают AlphaGo, игровые боты и реальные роботы. На примерах показано, почему ИИ принимает неожиданные решения, как его учат в цифровом мире и почему формально правильная цель может привести к странному результату.
Содержание:
00:00 Введение
00:32 Три метода машинного обучения
01:07 Обучение с учителем
02:32 Обучение без учителя
04:04 Обучение с подкреплением
11:10 Обучение с подкреплением в играх: AlphaGo vs. чемпион мира по го
14:24 Обучение с подкреплением в Dota 2 (OpenAI Five)
16:19 Почему ИИ выиграл у людей
18:44 Разработка стратегии в Dota: награда за правильное применение навыка
21:41 Промышленные манипуляторы и проблема мелкой моторики
23:16 Свой робот в лаборатории
27:37 Цифровой двойник робота: обучение в виртуальной среде
29:13 Сенсоризация цифрового двойника: семь контактов стопы
31:52 Параметры обучения
34:47 Результаты
36:01 Финал: робот прошёл 2 м, прыгая на одной ноге
40:00 Обсуждение
Снято на Фестивале науки — 2024
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: