ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

[ICON Fall25 Seminar] Kaiqing Zhang (UMD)

Автор: Purdue ICON

Загружено: 2025-09-12

Просмотров: 255

Описание: Seminar Information:
Date/Time: September 12, Friday, 3 - 4:30 pm, ET
Location: MSEE 112
Presenter: Kaiqing Zhang, Assistant Professor, University of Maryland
Title: Towards Principled AI Agents under Decentralized and Asymmetric
Abstract: AI Models have been increasingly deployed to develop "Autonomous Agents" for decision-making, with prominent application examples including playing Go and video games, robotics, autonomous driving, healthcare, human-assistant, etc. Most such success stories naturally involve multiple AI-agents interacting dynamically with each other and humans. More importantly, these agents oftentimes operate with asymmetric information in practice, both across different agents and across the training-testing phases. In this talk, we will share some of our recent explorations in understanding (multi-)AI-agents' decision-making under such decentralized and asymmetric information. First, we will focus on Reinforcement Learning (RL)-Agents, in partially observable environments: we will analyze the pitfalls and efficiency of RL in partially observable Markov decision processes when there is privileged information in training, a common practice in robot learning and deep RL, and in partially observable stochastic games, when information-sharing is allowed among decentralized agents. We will show the provable benefits of privileged information and information sharing in these cases. Second, we will examine Large-Language-Model (LLM)-(powered-)Agents, which use LLM as the main controller for decision-making, by understanding and enhancing their decision-making capability in canonical decentralized and multi-agent scenarios. In particular, we use the metric of Regret, commonly studied in Online Learning and RL, to understand LLM-agents’ decision-making limits in context and in controlled experiments. Motivated by the observed pitfalls of existing LLM agents, we also proposed a new fine-tuning loss to promote the no-regret behaviors of the models, both provably and experimentally. Time permitting, we will conclude with some additional thoughts on building principled AI Agents for decision-making with information constraints.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
[ICON Fall25 Seminar] Kaiqing Zhang (UMD)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

[ICON Fall25 Welcome Event] Introduction, Lightning Talks, and Seminar

[ICON Fall25 Welcome Event] Introduction, Lightning Talks, and Seminar

[ICON Fall25 Seminar] Hao Su (NYU) #wearabletech #surgicalrobotics #robotics #control

[ICON Fall25 Seminar] Hao Su (NYU) #wearabletech #surgicalrobotics #robotics #control

[AI Talks] Gen AI 2026: What Will Shape the Future

[AI Talks] Gen AI 2026: What Will Shape the Future

[ICON Seminar] Prof. Shin Donghoon (KMOU) #autonomousdriving #datadrivendecisionmaking

[ICON Seminar] Prof. Shin Donghoon (KMOU) #autonomousdriving #datadrivendecisionmaking

[ICON Fall25 Seminar] Ningshi Yao (GMU) #robotics #blimp #control #uavs

[ICON Fall25 Seminar] Ningshi Yao (GMU) #robotics #blimp #control #uavs

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Prof. Junmin Wang (UT Austin) #autonomy #autonomousvehicle #safety #robotics

Prof. Junmin Wang (UT Austin) #autonomy #autonomousvehicle #safety #robotics

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

[ICON Fall25 Seminar] Mark Yim (UPenn) #robotics #autonomy #grasp

[ICON Fall25 Seminar] Mark Yim (UPenn) #robotics #autonomy #grasp

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

[ICON Fall25 Seminar] Jackson Kulik (USU) #control #Cislunar #tensor

[ICON Fall25 Seminar] Jackson Kulik (USU) #control #Cislunar #tensor

Мы будем жить до 130 лет! Как создатель Maps.me Юрий Мельничек делает лекарство от старости

Мы будем жить до 130 лет! Как создатель Maps.me Юрий Мельничек делает лекарство от старости

Для Чего РЕАЛЬНО Нужен был ГОРБ Boeing 747?

Для Чего РЕАЛЬНО Нужен был ГОРБ Boeing 747?

Тренды в ИИ 2026. К чему готовиться каждому.

Тренды в ИИ 2026. К чему готовиться каждому.

Prof. Herschel C. Pangborn (Penn State Univ.) #controltheroy #motionplanning #robotics

Prof. Herschel C. Pangborn (Penn State Univ.) #controltheroy #motionplanning #robotics

ICON Seminar: Dr. Ehsan Moradi-Pari (Honda Research Institute) #human-AI-Teamwork #multi-agent

ICON Seminar: Dr. Ehsan Moradi-Pari (Honda Research Institute) #human-AI-Teamwork #multi-agent

ICON-ME Seminar: Prof. Mark Spong (2020 Rufus Oldenberger Medalist, ASME) #DNA #controltheory

ICON-ME Seminar: Prof. Mark Spong (2020 Rufus Oldenberger Medalist, ASME) #DNA #controltheory

ЧАСЫ С ТОЧНОСТЬЮ ДО МИКРОНА. Откуда в XVIII веке БЕЗ СТАНКОВ взялись эти механизмы?

ЧАСЫ С ТОЧНОСТЬЮ ДО МИКРОНА. Откуда в XVIII веке БЕЗ СТАНКОВ взялись эти механизмы?

The Man Behind Google's AI Machine | Demis Hassabis Interview

The Man Behind Google's AI Machine | Demis Hassabis Interview

Когнитивные искажения и ошибки восприятия. Лекция в Ереване. День 1

Когнитивные искажения и ошибки восприятия. Лекция в Ереване. День 1

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]