社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

1天轻松搞定python必背单词，就这8个块！

ChatGPT 桌面应用上线 ChatGPT Voice 功能，支持语音控制电脑并协调多个Agent...

GitHub 发生重大跨服务故障：Actions、Issues 等核心功能受影响

人文社科作者也能玩转Python，让文本数据自己“讲故事”

国内首部获证AIGC网络故事片《奇谭：纸刃渡荒墟》独家登陆爱奇艺

Python学不好你就死磕这个app

跟着APEC看蓉企⑦ | 这家成都企业，把AIGC“声”意做成出海产业

机器学习-arXiv人工精选-2026年7月最新论文20篇

+你，更快乐！爱奇艺发布创作者平台品牌和六大服务体系，全面赋能AIGC创作者

ChatGPT 桌面端推出 ChatGPT Voice；谷歌旗舰模型难产；菲尔兹奖得主 Jacob ...

关注

Py学习 » Python

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

专知 • 3 年前 • 1220 次点击

深度强化学习(Deep Reinforcement Learning, Deep RL)结合了深度学习和强化学习，人工智能体通过学习来解决顺序决策问题。在过去的十年中，深度RL在一系列问题上取得了显著的成果，从单人和多人游戏(如围棋、Atari游戏和DotA 2)到机器人。

《深度强化学习基础》是对深度学习的介绍，独特地结合了理论和实现。它从直觉开始，然后仔细地解释了深度RL算法的理论，讨论了其伴生软件库SLM Lab中的实现，最后介绍了使深度RL工作的实际细节。

本指南对于熟悉基本机器学习概念并对Python有实际理解的计算机科学学生和软件工程师都是理想的。

理解深度RL问题的每个关键方面
探索基于策略和价值的算法，包括REINFORCE、SARSA、DQN、Double DQN和优先体验重放(PER)
深入研究组合算法，包括actor - critical和近端策略优化(PPO)
理解如何同步和异步并行算法
在SLM Lab中运行算法，学习深入RL工作的实际实现细节
探索调优超参数的算法基准测试结果
理解深度RL环境是如何设计的

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）
后台回复“R413” 就可以获取《【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf》专知下载链接

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“阅读原文”，了解使用专知，查看获取100000+AI主题知识资料

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/149522

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号