深度强化学习(Deep Reinforcement Learning, Deep RL)结合了深度学习和强化学习,人工智能体通过学习来解决顺序决策问题。在过去的十年中,深度RL在一系列问题上取得了显著的成果,从单人和多人游戏(如围棋、Atari游戏和DotA 2)到机器人。
《深度强化学习基础》是对深度学习的介绍,独特地结合了理论和实现。它从直觉开始,然后仔细地解释了深度RL算法的理论,讨论了其伴生软件库SLM Lab中的实现,最后介绍了使深度RL工作的实际细节。
本指南对于熟悉基本机器学习概念并对Python有实际理解的计算机科学学生和软件工程师都是理想的。
理解深度RL问题的每个关键方面
探索基于策略和价值的算法,包括REINFORCE、SARSA、DQN、Double DQN和优先体验重放(PER)
深入研究组合算法,包括actor - critical和近端策略优化(PPO)
理解如何同步和异步并行算法
在SLM Lab中运行算法,学习深入RL工作的实际实现细节
探索调优超参数的算法基准测试结果
理解深度RL环境是如何设计的
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询!点击“阅读原文”,了解使用专知,查看获取100000+AI主题知识资料