ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Challenges in Reward Design for Reinforcement Learning-based Traffic Signal Control

Автор: Eclipse Foundation

Загружено: 2023-05-29

Просмотров: 1558

Описание: Deep Reinforcement Learning (DRL) is a promising data-driven approach for traffic signal control, especially because DRL can learn to adapt to varying traffic demands. For that, DRL agents maximize a scalar reward by interacting with an environment. However, one needs to formulate a suitable reward, aligning agent behavior and user objectives, which is an open research problem. We investigate this problem in the context of traffic signal control with the objective of minimizing CO2 emissions at intersections. Because CO2 emissions can be affected by multiple factors outside the agent’s control, it is unclear if an emission-based metric works well as a reward, or if a proxy reward is needed. To obtain a suitable reward, we evaluate various rewards and combinations of rewards. For each reward, we train a Deep Q-Network (DQN) on homogeneous and heterogeneous traffic scenarios. We use the SUMO (Simulation of Urban MObility) simulator and its default emission model to monitor the agent’s performance on the specified rewards and CO2 emission. Our experiments show that a CO2 emission-based reward is inefficient for training a DQN, the agent’s performance is sensitive to variations in the parameters of combined rewards, and some reward formulations do not work equally well in different scenarios. Based on these results, we identify desirable reward properties that have implications to reward design for reinforcement learning-based traffic signal control.

--

Title: Challenges in Reward Design for Reinforcement Learning-based Traffic Signal Control: An Investigation using a CO2 Emission Objective

Presenters: Christian Medeiros Adriano and Max Schumacher

Authors: Max Schumacher, Christian Medeiros Adriano and Holger Giese

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Challenges in Reward Design for Reinforcement Learning-based Traffic Signal Control

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Sensor-based Flow Optimization on connected real-world intersections via a SUMO Feature Gap Analysis

Sensor-based Flow Optimization on connected real-world intersections via a SUMO Feature Gap Analysis

Tutorial – SUMO User Conference 2023

Tutorial – SUMO User Conference 2023

Deep reinforcement learning - Traffic Light Control System

Deep reinforcement learning - Traffic Light Control System

Evaluating the benefits of promoting intermodality and active modes in urban transport …

Evaluating the benefits of promoting intermodality and active modes in urban transport …

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Как работают сигналы дорожного движения?

Как работают сигналы дорожного движения?

Странности фронта последних недель

Странности фронта последних недель

Промты уже прошлое. 4 шага как обучиться работе с нейросетями за 7 дней

Промты уже прошлое. 4 шага как обучиться работе с нейросетями за 7 дней

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Overcoming the Practical Challenges when using Reinforcement Learning

Overcoming the Practical Challenges when using Reinforcement Learning

Stanford CS234: Reinforcement Learning | Winter 2019 | Lecture 1 - Introduction - Emma Brunskill

Stanford CS234: Reinforcement Learning | Winter 2019 | Lecture 1 - Introduction - Emma Brunskill

Обучение с подкреплением с нуля

Обучение с подкреплением с нуля

Лучший документальный фильм про создание ИИ

Лучший документальный фильм про создание ИИ

Обучение с подкреплением для агентов — Уилл Браун, исследователь машинного обучения в Morgan Stanley

Обучение с подкреплением для агентов — Уилл Браун, исследователь машинного обучения в Morgan Stanley

A Comparison of Reinforcement Learning Agents Applied to Traffic Signal Optimization

A Comparison of Reinforcement Learning Agents Applied to Traffic Signal Optimization

Reinforcement Learning Series: Overview of Methods

Reinforcement Learning Series: Overview of Methods

Can AI Fix Traffic?

Can AI Fix Traffic?

Понимание GD&T

Понимание GD&T

ИНДИЯ В МУСОРЕ. Как страна превратилась в мировую свалку?

ИНДИЯ В МУСОРЕ. Как страна превратилась в мировую свалку?

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]