Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 6 - Reinforcement Learning Primer

Автор: Stanford Online

Загружено: 2020-02-25

Просмотров: 10140

Описание: For more information about Stanford’s Artificial Intelligence professional and graduate programs, visit: https://stanford.io/ai

Assistant Professor Chelsea Finn, Stanford University
http://cs330.stanford.edu/

0:00 Introduction
0:46 Logistics
2:31 Why Reinforcement Learning?
3:37 The Plan
6:16 Terminology & notation
8:36 Imitation Learning
10:01 Reward functions
10:57 The goal of reinforcement learning
19:15 What is a reinforcement learning task?
21:01 The goal of multi-task reinforcement learning
23:31 The anatomy of a reinforcement learning algorithm
25:48 Evaluating the objective
26:43 Direct policy differentiation
32:02 Evaluating the policy gradient
33:16 Comparison to maximum likelihood
35:54 Example: MAML + policy gradient
37:25 Example: Black-box meta-learning + policy gradient
45:26 Policy Gradients
49:16 Value-Based RL: Definitions
52:14 Fitted Q-iteration Algorithm
56:13 Multi-Task RL Algorithms
58:00 An example

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 6 - Reinforcement Learning Primer

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 7 - Kate Rakelly (UC Berkeley)

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 7 - Kate Rakelly (UC Berkeley)

General Relativity Lecture 1

General Relativity Lecture 1

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 5 - Bayesian Meta-Learning

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 5 - Bayesian Meta-Learning

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 11 - Sergey Levine (UC Berkeley)

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 11 - Sergey Levine (UC Berkeley)

4 Hours Chopin for Studying, Concentration & Relaxation

4 Hours Chopin for Studying, Concentration & Relaxation

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 1 - Transformer

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 1 - Transformer

Мы стоим на пороге нового конфликта! Что нас ждет дальше? Андрей Безруков про США, Россию и кризис

Мы стоим на пороге нового конфликта! Что нас ждет дальше? Андрей Безруков про США, Россию и кризис

Лучший документальный фильм про создание ИИ

Лучший документальный фильм про создание ИИ

Математическая тревожность, нейросети, задачи тысячелетия / Андрей Коняев

Математическая тревожность, нейросети, задачи тысячелетия / Андрей Коняев

Lecture 1 | String Theory and M-Theory

Lecture 1 | String Theory and M-Theory

The LLM Revolution Is Over. The Physical AI Revolution Is Coming Fast

The LLM Revolution Is Over. The Physical AI Revolution Is Coming Fast

Stanford AI Club: Jeff Dean on Important AI Trends

Stanford AI Club: Jeff Dean on Important AI Trends

[AUTOML23] A Tutorial on MetaReinforcement Learning

[AUTOML23] A Tutorial on MetaReinforcement Learning

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 2 - Multi-Task & Meta-Learning Basics

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 2 - Multi-Task & Meta-Learning Basics

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Einstein's General Theory of Relativity | Lecture 1

Einstein's General Theory of Relativity | Lecture 1

Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI

Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI

Model-free vs Model-based Reinforcement Learning -- Oriol Vinyals (11/10/2020)

Model-free vs Model-based Reinforcement Learning -- Oriol Vinyals (11/10/2020)

Визуализация скрытого пространства: PCA, t-SNE, UMAP | Глубокое обучение с анимацией

Визуализация скрытого пространства: PCA, t-SNE, UMAP | Глубокое обучение с анимацией

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение