ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Cam Allen - The Agent Must Choose the Problem Model

Автор: RL and Agents Reading Group

Загружено: 2025-11-19

Просмотров: 73

Описание: RL & Agents Reading Group | 24 July 2025

Speaker(s): Cam Allen
Title: The Agent Must Choose the Problem Model

Abstract:
Reinforcement learning agents have it easy. Their problem model comes pre-specified from the first time step of their deployment. Observations, actions, rewards—even the learning algorithm—are pre-arranged, expert-designed, and hand-tuned to help the agent accomplish its task. But models can be wrong. If the agent's problem model turns out to be inadequate, no one is coming to help. Autonomous agents must adapt. How can we build agents that handle such daunting ambiguity? I'll present some initial progress in that direction: an agent that can detect when its observations are incomplete and learn a memory function to compensate. The result is a first step towards agents that choose their own problem models.

Main paper:
Mitigating Partial Observability in Sequential Decision Processes via the Lambda Discrepancy (https://camallen.net/files/lambda_dis...)

Supporting papers:
Learning Markov State Abstractions for Deep Reinforcement Learning (https://camallen.net/files/markov_sta...)
Memory as State Abstraction over Trajectories(https://camallen.net/files/traj_abstr...)

Bio:
Cam Allen is a postdoctoral fellow at the Center for Human-Compatible Artificial Intelligence at the University of California, Berkeley. His research centers on problem formalization: what are the right conceptual models to express the problems we are trying to solve, and how can we build agents that help us model and solve those problems? More generally, Cam is interested in the foundations of intelligence—the computations that enable agency, learning, planning, abstraction, and interaction. He completed his PhD in Computer Science at Brown University in 2023, where he studied structured abstractions for general-purpose decision making, and he co-taught Berkeley's introductory AI course in spring 2024.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Cam Allen - The Agent Must Choose the Problem Model

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Это самый глубокий уровень материи?

Это самый глубокий уровень материи?

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Eduardo Pignatelli - On the temporal credit assignment in Deep RL

Eduardo Pignatelli - On the temporal credit assignment in Deep RL

Mattie Fellows - Simplifying Deep Temporal Difference Learning

Mattie Fellows - Simplifying Deep Temporal Difference Learning

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Может ли у ИИ появиться сознание? — Семихатов, Анохин

Может ли у ИИ появиться сознание? — Семихатов, Анохин

Комплексные числа: коротко и понятно – Алексей Савватеев | Лекции по математике | Научпоп

Комплексные числа: коротко и понятно – Алексей Савватеев | Лекции по математике | Научпоп

Лучший документальный фильм про создание ИИ

Лучший документальный фильм про создание ИИ

Нефть за 100: как война в Иране превращается в мировой экономический кризис

Нефть за 100: как война в Иране превращается в мировой экономический кризис

Альтермагнетики: новый вид магнетизма или хайп? – Семихатов, Перов

Альтермагнетики: новый вид магнетизма или хайп? – Семихатов, Перов

Алексей Савватеев. Зачем нужно высшее образование? | ТОЛК

Алексей Савватеев. Зачем нужно высшее образование? | ТОЛК

10 years of AlphaGo: The turning point for AI | Thore Graepel & Pushmeet Kohli

10 years of AlphaGo: The turning point for AI | Thore Graepel & Pushmeet Kohli

РАЗВИВАЕМ СЛУХ - Интервалы на слух за 20 минут

РАЗВИВАЕМ СЛУХ - Интервалы на слух за 20 минут

Фильм Алексея Семихатова «ГРАВИТАЦИЯ»

Фильм Алексея Семихатова «ГРАВИТАЦИЯ»

Гипотеза Пуанкаре — Алексей Савватеев на ПостНауке

Гипотеза Пуанкаре — Алексей Савватеев на ПостНауке

Электричество НЕ течёт по проводам — тревожное открытие Ричарда Фейнмана

Электричество НЕ течёт по проводам — тревожное открытие Ричарда Фейнмана

ВАНГА: Проект спецслужб или феномен века? / Личности / МИНАЕВ

ВАНГА: Проект спецслужб или феномен века? / Личности / МИНАЕВ

Matthew Jackson and Jarek Liesen (Oxford) - A Clean Slate for Offline RL

Matthew Jackson and Jarek Liesen (Oxford) - A Clean Slate for Offline RL

David Abel - A Definition of Continual Reinforcement Learning

David Abel - A Definition of Continual Reinforcement Learning

Adam White - Empirical Design in Reinforcement Learning

Adam White - Empirical Design in Reinforcement Learning

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]