ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Contextual Bandit: from Theory to Applications. - Vernade - Workshop 3 - CEB T1 2019

Автор: Institut Henri Poincaré

Загружено: 2019-05-10

Просмотров: 12065

Описание: Claire Vernade (Google Deepmind) / 05.04.2019

Contextual Bandit: from Theory to Applications.

Trading exploration versus exploration is a key problem in computer science: it is about learning how to make decisions in order to optimize a long-term cost. While many areas of machine learning aim at estimating a hidden function given a dataset, reinforcement learning is rather about optimally building a dataset of observations of this hidden function that contains just enough information to guarantee that the maximum is being properly estimated. The first part of this talk reviews the main techniques and results known on the contextual linear bandit. We'll mostly rely on the recent book of Lattimore and Szepesvari (2019) [1]. Indeed, real-world problems often don't behave as the theory would like them to. In the second part of this talk, we want to share our experience in applying bandit algorithms in industry [2]. In particular, it appears that while the system is supposed to be interacting with its environment, the customers' feedback is often delayed or missing and does not allow to perform the necessary updates. We propose a solution to this issue, propose some alternative models and architecture, and finish the presentation with open questions on sequential learning beyond bandits.
[1] Lattimore, Tor, and Csaba Szepesvári. Bandit algorithms. preprint (2018).
[2] Vernade, Claire, et al. Contextual bandits under delayed feedback. arXiv preprint arXiv:1807.02089 (2018)

----------------------------------
Vous pouvez nous rejoindre sur les réseaux sociaux pour suivre nos actualités.

Facebook :   / instituthenripoincare  
Twitter :   / inhenripoincare  
Instagram :   / instituthenripoincare  

*************************************
Langue : Anglais; Date : 05.04.2019; Conférencier : Vernade, Claire; Évenement : Workshop 3 - CEB T1 2019; Lieu : IHP; Mots Clés :

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Contextual Bandit: from Theory to Applications. - Vernade - Workshop 3 - CEB T1 2019

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

On the Global Convergence of Gradient Descent for (...) - Bach - Workshop 3 - CEB T1 2019

On the Global Convergence of Gradient Descent for (...) - Bach - Workshop 3 - CEB T1 2019

Optimization and Contextual Bandits at Stripe

Optimization and Contextual Bandits at Stripe

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Reinforcement Learning: Machine Learning Meets Control Theory

Reinforcement Learning: Machine Learning Meets Control Theory

Введение в методы градиента политики — глубокое обучение с подкреплением

Введение в методы градиента политики — глубокое обучение с подкреплением

Теорема Байеса, геометрия изменения убеждений

Теорема Байеса, геометрия изменения убеждений

Как работала машина

Как работала машина "Энигма"?

À la recherche de la matière cachée de l'Univers

À la recherche de la matière cachée de l'Univers

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана

Выборка Томпсона, однорукие бандиты и бета-распределение

Выборка Томпсона, однорукие бандиты и бета-распределение

Как сжимаются изображения? [46 МБ ↘↘ 4,07 МБ] JPEG в деталях

Как сжимаются изображения? [46 МБ ↘↘ 4,07 МБ] JPEG в деталях

Multi-armed bandit algorithms: Thompson Sampling

Multi-armed bandit algorithms: Thompson Sampling

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

Градиентный спуск, как обучаются нейросети | Глава 2, Глубинное обучение

Contextual Bandits: better than A/B tests for production ML

Contextual Bandits: better than A/B tests for production ML

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

The Contextual Bandits Problem

The Contextual Bandits Problem

Taming the Monster: A Fast and Simple Algorithm for Contextual Bandits

Taming the Monster: A Fast and Simple Algorithm for Contextual Bandits

What the heck are

What the heck are "contextual bandits"?!

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Bandit Algorithms - 1

Bandit Algorithms - 1

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]