Evolutionary Game Theory and Robustness in RL – Callum Lawson – PIBBSS Symposium '25

Автор: Principles of Intelligence

Загружено: 2025-10-09

Просмотров: 58

Описание: This video was recorded during the 2025 PIBBSS Symposium. Read more about it on our website:
https://pibbss.ai/symposium-25/

About the talk:
Adaptive training environments have been central to superhuman AI performance in games and are increasingly used to train agentic LLMs. They also offer a route to scaling alignment, through Unsupervised Environment Design (UED) algorithms that search for failure cases and redirect training to fix them. Yet such arms races between agents and environments can follow many paths, only some of which yield robustness. In this talk, we’ll explore how evolutionary game theory (EGT) could help anticipate these dynamics. We’ll link policy gradients to selection gradients and adaptive environments to resource competition, and present a first-step evolutionary UED algorithm that shows similar training dynamics to existing approaches. We’ll also highlight key challenges, such as quantifying trade-offs under the transient regimes typical of UED. Addressing these issues could establish EGT as a principled framework for steering adaptive environment design, helping direct training toward more robust and aligned agents.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Evolutionary Game Theory and Robustness in RL – Callum Lawson – PIBBSS Symposium '25

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

The Mechanics of Counting in Transformer LMs – Franz Nowak – PIBBSS Symposium '25

The Mechanics of Counting in Transformer LMs – Franz Nowak – PIBBSS Symposium '25

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Файлы Эпштейна | Илон Маск, Билл Гейтс и ЗППП от русских девушек (English subtitles) @Максим Кац

Файлы Эпштейна | Илон Маск, Билл Гейтс и ЗППП от русских девушек (English subtitles) @Максим Кац

«Память на молекулярном уровне: сценарии консолидации». Константин Анохин

«Память на молекулярном уровне: сценарии консолидации». Константин Анохин

Как работала машина

Как работала машина "Энигма"?

Савватеев разоблачает фокусы Земскова

Савватеев разоблачает фокусы Земскова

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

Большого взрыва НЕ БЫЛО? Правдивая история появления Вселенной / Астрофизик Натан Эйсмонт

Большого взрыва НЕ БЫЛО? Правдивая история появления Вселенной / Астрофизик Натан Эйсмонт

Теренс Тао: Сложнейшие задачи математики, физики и будущее ИИ | Лекс Фридман Подкаст #472

Теренс Тао: Сложнейшие задачи математики, физики и будущее ИИ | Лекс Фридман Подкаст #472

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

Сонин про крах экономики, цены на нефть и страхи Путина 🎙 Честное слово с Константином Сониным

Сонин про крах экономики, цены на нефть и страхи Путина 🎙 Честное слово с Константином Сониным

1. Introduction to the Human Brain

1. Introduction to the Human Brain

Важные открытия XXI века: почему рак победил и что не так с клонированием? Что скрывают нобелевки?

Важные открытия XXI века: почему рак победил и что не так с клонированием? Что скрывают нобелевки?

Local Geometry & Policy Properties – Dalcy Ku – PIBBSS Symposium '25

Local Geometry & Policy Properties – Dalcy Ku – PIBBSS Symposium '25

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана

Понимание GD&T