Inverse Reinforcement Learning Explained

Автор: Edan Meyer

Загружено: 2021-05-30

Просмотров: 13511

Описание: Inverse Reinforcement Learning (Inverse RL / IRL) is a type of RL where the objective is opposite from forward RL. Instead of learning a policy from a reward function, we are trying to learn a reward function from a policy or demonstration of a task. In this video I go through why to use Inverse Reinforcement Learning, why to use Inverse RL, examples of IRL, some of the theory, and some existing IRL methods. I cover one of the original papers by Andrew Ng, as well as some newer works on Maximum Entropy IRL (MaxEnt IRL), and Adversarial IRL.

RL Theory playlist: • Intro to Reinforcement Learning Made Simple

IRL Algorithms paper: https://ai.stanford.edu/~ang/papers/i...
MaxEnt IRL paper: https://www.aaai.org/Papers/AAAI/2008...
Adversarial IRL paper: https://arxiv.org/abs/1710.11248

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Inverse Reinforcement Learning Explained

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Learning Language Through Games [Zero to Paper]

Learning Language Through Games [Zero to Paper]

Learning Forever, Backprop Is Insufficient

Learning Forever, Backprop Is Insufficient

CS885 Lecture17c: Inverse Reinforcement Learning

CS885 Lecture17c: Inverse Reinforcement Learning

2 года моих исследований, изложенные за 13 минут

2 года моих исследований, изложенные за 13 минут

Reinforcement Learning Upside Down

Reinforcement Learning Upside Down

99,9% — легко, 100% — сложно.

99,9% — легко, 100% — сложно.

Обучение с подкреплением на основе моделей наконец-то работает!

Обучение с подкреплением на основе моделей наконец-то работает!

Policy Gradient Theorem Explained - Reinforcement Learning

Policy Gradient Theorem Explained - Reinforcement Learning

DeepSeek's GRPO (Group Relative Policy Optimization) | Reinforcement Learning for LLMs

DeepSeek's GRPO (Group Relative Policy Optimization) | Reinforcement Learning for LLMs

Deep RL Bootcamp Lecture 10B Inverse Reinforcement Learning

Deep RL Bootcamp Lecture 10B Inverse Reinforcement Learning

Вот как читать дифференциальные уравнения.

Вот как читать дифференциальные уравнения.

Proximal Policy Optimization Explained

Proximal Policy Optimization Explained

Зачем нужна топология?

Зачем нужна топология?

Обучение RL по видео на YouTube

Обучение RL по видео на YouTube

OpenAI ВЫКАТИЛА МОНСТРА! Глобальный АПГРЕЙД GPT! Маск СТИРАЕТ КОД! Разработка МЫСЛЬЮ! PYTHON ВСЁ

OpenAI ВЫКАТИЛА МОНСТРА! Глобальный АПГРЕЙД GPT! Маск СТИРАЕТ КОД! Разработка МЫСЛЬЮ! PYTHON ВСЁ

Почему Питер Шольце — математик, каких бывает раз в поколение?

Почему Питер Шольце — математик, каких бывает раз в поколение?

XIRL: Cross embodiment Inverse Reinforcement Learning by Kevin Zakka, Andy Zeng, Pete Florence, Jona

XIRL: Cross embodiment Inverse Reinforcement Learning by Kevin Zakka, Andy Zeng, Pete Florence, Jona

CS 285: Lecture 20, Inverse Reinforcement Learning, Part 1

CS 285: Lecture 20, Inverse Reinforcement Learning, Part 1

Inverse Reinforcement Learning Example

Inverse Reinforcement Learning Example

Обучение с подкреплением с нуля

Обучение с подкреплением с нуля