《深度强化学习实践手册：应用现代RL方法，包括深度Q网络、值迭代、策略梯度、TRPO、AlphaGo等》PDF-547页

最近强化学习(RL)与深度学习(DL)相结合，在训练智能体以类似人类的方式解决复杂问题方面取得了前所未有的进展。谷歌使用算法来玩并击败著名的雅达利街机游戏，使该领域变得突出，研究人员正在以快速的速度产生新的想法。 Deep Reinforcement Learning hands是一本关于最新深度学习工具及其局限性的全面指南。在将交叉熵和策略梯度等方法应用于现实环境之前，您将对它们进行评估。比如雅达利(Atari)的虚拟游戏和家庭最喜欢的Connect4。本书介绍了RL的基础知识，为你提供了编写智能学习智能体的诀窍，以承担一系列艰巨的实际任务。了解如何在grid world环境中实现Q-learning，教您的智能体购买和交易股票，并了解自然语言模型如何推动聊天机器人的繁荣。

目录内容：

Chapter 2: OpenAI Gym *

Chapter 3: Deep Learning with PyTorch *

Chapter 4: Cross Entropy method *

Chapter 5: Tabular learning and the Bellman equation *

Chapter 6: Deep Q-Networks *

Chapter 7: DQN extensions *

Chapter 8: Stocks trading using RL *

Chapter 9: Policy Gradients: an alternative *

Chapter 10: Actor-Critic method *

Chapter 11: Asynchronous Advantage Actor-Critic *

Chapter 12: Chatbots traning with RL *

Chapter 13: Web navigation *

Chapter 14: Continuous action space *

Chapter 15: Trust regions: TRPO, PPO and ACKTR *

Chapter 16: Black-box optimisation in RL *

Chapter 17: Beyond model-free: imagination *

Chapter 18: AlphaGo Zero

下载权限

查看

￥

免费下载

评论并刷新后下载

登录后下载

查看演示

{{attr.name}}：

您当前的等级为

登录后免费下载登录小黑屋反思中，不准下载！评论后刷新页面下载评论支付以后下载请先登录您今天的下载次数（次）用完了，请明天再来支付积分以后下载立即支付支付以后下载立即支付您当前的用户组不允许下载升级会员

您已获得下载权限您可以每天下载资源次，今日剩余次

{{userData.name}}已认证

《深度强化学习实践手册：应用现代RL方法，包括深度Q网络、值迭代、策略梯度、TRPO、AlphaGo等》PDF-547页

下载权限

查看演示

Midjourney-AI艺术创作平台

Boomy-AI音乐创作协作工具

Movie To Emoji-有趣的转化表情符号的工具

Namelix-智能的LOGO生成工具

Adcreative-AI创意广告平台