Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 7 - Kate Rakelly (UC Berkeley)

Автор: Stanford Online

Загружено: 2020-02-25

Просмотров: 8230

Описание: For more information about Stanford’s Artificial Intelligence professional and graduate programs, visit: https://stanford.io/ai

Kate Rakelly (UC Berkeley) Guest Lecture in Stanford CS330
http://cs330.stanford.edu/

0:00 Introduction
0:17 Lecture outline
1:07 Recap: meta-reinforcement learning
3:55 What's different in RL?
5:33 PG meta-RL algorithms: recurrent Implement the policy as a recurrent network, train
7:41 PG meta-RL algorithms: gradients
9:57 How these algorithms learn to explore
15:27 What's the problem?
22:45 Meta-RL desiderata
28:43 Model belief over latent task variables POMDP for unobserved state
33:49 Posterior sampling in action
35:07 Meta-RL with task-belief states
38:18 Encoder design
43:45 Integrating task-belief with SAC
46:23 Separate task-Inference and RL data
52:16 Limits of posterior sampling
55:06 Summary

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 7 - Kate Rakelly (UC Berkeley)

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 8 - Model-Based Reinforcement Learning

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 8 - Model-Based Reinforcement Learning

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 9 - Lifelong Learning

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 9 - Lifelong Learning

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Нейробиолог: Как не отупеть к 50 годам. Связь слабоумия и привычек | Владимир Алипов

Нейробиолог: Как не отупеть к 50 годам. Связь слабоумия и привычек | Владимир Алипов

4 Hours Chopin for Studying, Concentration & Relaxation

4 Hours Chopin for Studying, Concentration & Relaxation

Linguistics Lecture - UC Berkeley - Introduction to Optimality Theory in Phonology

Linguistics Lecture - UC Berkeley - Introduction to Optimality Theory in Phonology

J.S. Bach: French Suites

J.S. Bach: French Suites

Лучший документальный фильм про создание ИИ

Лучший документальный фильм про создание ИИ

А.Н.Петрова. Мастер-класс по сценической речи в ВТУ им. М.С.Щепкина 30.09.21г.

А.Н.Петрова. Мастер-класс по сценической речи в ВТУ им. М.С.Щепкина 30.09.21г.

«Я понял, что это конец»: как создатель «Алисы» уволился из «Сбера», эмигрировал и строит AI-стартап

«Я понял, что это конец»: как создатель «Алисы» уволился из «Сбера», эмигрировал и строит AI-стартап

1. Introduction to the Human Brain

1. Introduction to the Human Brain

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 1 - Introduction & Overview

Stanford CS330: Multi-Task and Meta-Learning, 2019 | Lecture 1 - Introduction & Overview

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Mozart: Complete Piano Sonatas

Mozart: Complete Piano Sonatas

Strong Generalization from Small Brains and No Training Data

Strong Generalization from Small Brains and No Training Data

Выводы за 37 лет мед. практики: 4 способа замедлить старение по науке | Доктор Тарасевич

Выводы за 37 лет мед. практики: 4 способа замедлить старение по науке | Доктор Тарасевич

Спокойная классика | Бах, Бетховен, Шопен, Дебюсси, Лист, Мендельсон, Моцарт, Сати, Шуман

Спокойная классика | Бах, Бетховен, Шопен, Дебюсси, Лист, Мендельсон, Моцарт, Сати, Шуман

Когнитивные искажения и ошибки восприятия. Лекция в Ереване. День 1

Когнитивные искажения и ошибки восприятия. Лекция в Ереване. День 1

Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 1: Class Intro

Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 1: Class Intro

Lecture 15: Brain-Computer Interfaces | COGSCI 1 | UC Berkeley

Lecture 15: Brain-Computer Interfaces | COGSCI 1 | UC Berkeley