强化学习方法汇总 (Reinforcement Learning)

Автор: Morvan Zhou

Загружено: 2017-01-05

Просмотров: 54340

Описание: 强化学习包括了很多种方法, 我们来对比一下各种不同的方法, 让你有大概的了解.

(q learning, sarsa, sarsa lambda, policy gradients, deep q network, model-based RL, model-free RL, value-based, policy-based, on-policy, off-policy, Monte Carlo, Temporal difference)

详细的文字教程: https://mofanpy.com/tutorials/machine...
有趣的机器学习列表: https://mofanpy.com/tutorials/machine...
Code in Github: https://github.com/MorvanZhou/tutoria...
通过 "莫烦 Python" 支持我做出更好的视频: https://mofanpy.com/support/
通过翻译,帮助其他语言的观看者:http://www.youtube.com/timedtext_cs_p...

强化学习 QQ 群交流: 294229279

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

强化学习方法汇总 (Reinforcement Learning)

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

#1 why? (强化学习 Reinforcement Learning 教学)

#1 why? (强化学习 Reinforcement Learning 教学)

深度强化学习(3/5)：策略学习 Policy-Based Reinforcement Learning

深度强化学习(3/5)：策略学习 Policy-Based Reinforcement Learning

#6.4 PPO/DPPO Proximal Policy Optimization (强化学习 Reinforcement Learning with tensorflow 教学)

#6.4 PPO/DPPO Proximal Policy Optimization (强化学习 Reinforcement Learning with tensorflow 教学)

Reinforcement Learning Series: Overview of Methods

Reinforcement Learning Series: Overview of Methods

【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (一) – 增強式學習跟機器學習一樣都是三個步驟

【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (一) – 增強式學習跟機器學習一樣都是三個步驟

I Built the Layer Microsoft IQ and ServiceNow AI Agents Are Both Missing

I Built the Layer Microsoft IQ and ServiceNow AI Agents Are Both Missing

什么是 Q Learning (Reinforcement Learning 强化学习)

什么是 Q Learning (Reinforcement Learning 强化学习)

Reinforcement Learning Course: Intro to Advanced Actor Critic Methods

Reinforcement Learning Course: Intro to Advanced Actor Critic Methods

【機器學習2021】預測本頻道觀看人數 (下) - 深度學習基本概念簡介

【機器學習2021】預測本頻道觀看人數 (下) - 深度學習基本概念簡介

Музыка лечит сердце и сосуды🌸 Успокаивающая музыка восстанавливает нервную систему,расслабляющая

Музыка лечит сердце и сосуды🌸 Успокаивающая музыка восстанавливает нервную систему,расслабляющая

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Как заговорить на любом языке? Главная ошибка 99% людей в изучении. Полиглот Дмитрий Петров.

Как заговорить на любом языке? Главная ошибка 99% людей в изучении. Полиглот Дмитрий Петров.

Python + PyTorch + Pygame Reinforcement Learning – Train an AI to Play Snake

Python + PyTorch + Pygame Reinforcement Learning – Train an AI to Play Snake

НОЧНОЙ УДАР: Иран атакует Израиль. ПВО не справляется

НОЧНОЙ УДАР: Иран атакует Израиль. ПВО не справляется

深度强化学习(1/5)：基本概念 Deep Reinforcement Learning (1/5)

深度强化学习(1/5)：基本概念 Deep Reinforcement Learning (1/5)

一口气搞懂「强化学习」| Reinforcement Learning

一口气搞懂「强化学习」| Reinforcement Learning

Атаки дронов на Москву, которых никто не видел | Военный обзор Юрия Фёдорова

Атаки дронов на Москву, которых никто не видел | Военный обзор Юрия Фёдорова

25 самых прекрасных классических произведений для души и сердц ⛄ Моцарт, Шопен, Бах, Бетховен

25 самых прекрасных классических произведений для души и сердц ⛄ Моцарт, Шопен, Бах, Бетховен

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

ML Lecture 10: Convolutional Neural Network

ML Lecture 10: Convolutional Neural Network