ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 6 - Reinforcement Learning Primer

Автор: Stanford Online

Загружено: 2020-02-25

Просмотров: 10140

Описание: For more information about Stanford’s Artificial Intelligence professional and graduate programs, visit: https://stanford.io/ai

Assistant Professor Chelsea Finn, Stanford University
http://cs330.stanford.edu/


0:00 Introduction
0:46 Logistics
2:31 Why Reinforcement Learning?
3:37 The Plan
6:16 Terminology & notation
8:36 Imitation Learning
10:01 Reward functions
10:57 The goal of reinforcement learning
19:15 What is a reinforcement learning task?
21:01 The goal of multi-task reinforcement learning
23:31 The anatomy of a reinforcement learning algorithm
25:48 Evaluating the objective
26:43 Direct policy differentiation
32:02 Evaluating the policy gradient
33:16 Comparison to maximum likelihood
35:54 Example: MAML + policy gradient
37:25 Example: Black-box meta-learning + policy gradient
45:26 Policy Gradients
49:16 Value-Based RL: Definitions
52:14 Fitted Q-iteration Algorithm
56:13 Multi-Task RL Algorithms
58:00 An example

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 6 - Reinforcement Learning Primer

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 7 - Kate Rakelly (UC Berkeley)

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 7 - Kate Rakelly (UC Berkeley)

General Relativity Lecture 1

General Relativity Lecture 1

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 5 - Bayesian Meta-Learning

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 5 - Bayesian Meta-Learning

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 11 - Sergey Levine (UC Berkeley)

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 11 - Sergey Levine (UC Berkeley)

4 Hours Chopin for Studying, Concentration & Relaxation

4 Hours Chopin for Studying, Concentration & Relaxation

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 1 - Transformer

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 1 - Transformer

Мы стоим на пороге нового конфликта! Что нас ждет дальше? Андрей Безруков про США, Россию и кризис

Мы стоим на пороге нового конфликта! Что нас ждет дальше? Андрей Безруков про США, Россию и кризис

Лучший документальный фильм про создание ИИ

Лучший документальный фильм про создание ИИ

Математическая тревожность, нейросети, задачи тысячелетия / Андрей Коняев

Математическая тревожность, нейросети, задачи тысячелетия / Андрей Коняев

Lecture 1 | String Theory and M-Theory

Lecture 1 | String Theory and M-Theory

The LLM Revolution Is Over. The Physical AI Revolution Is Coming Fast

The LLM Revolution Is Over. The Physical AI Revolution Is Coming Fast

Stanford AI Club: Jeff Dean on Important AI Trends

Stanford AI Club: Jeff Dean on Important AI Trends

[AUTOML23]  A Tutorial on MetaReinforcement Learning

[AUTOML23] A Tutorial on MetaReinforcement Learning

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 2 - Multi-Task & Meta-Learning Basics

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 2 - Multi-Task & Meta-Learning Basics

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Einstein's General Theory of Relativity | Lecture 1

Einstein's General Theory of Relativity | Lecture 1

Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI

Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI

Model-free vs Model-based Reinforcement Learning -- Oriol Vinyals (11/10/2020)

Model-free vs Model-based Reinforcement Learning -- Oriol Vinyals (11/10/2020)

Визуализация скрытого пространства: PCA, t-SNE, UMAP | Глубокое обучение с анимацией

Визуализация скрытого пространства: PCA, t-SNE, UMAP | Глубокое обучение с анимацией

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]