作者 Maxim Maxim
作者,Maxim Lapan是一位深度学习爱好者,他感兴趣的领域是深度强化学习的实际应用。本书提供了有关最新DL工具及其局限性的全面指南。读者可以通过Atari虚拟游戏集和诸如Connect4之类的家族收藏,来了解包括交叉熵和策略梯度在内的评估方法。作者认为,读者可以期望学习以下内容:
· 评估RL方法,包括交叉熵,DQN,Actor-Critic,TRPO,PPO,DDPG,D4PG等
· 使用值迭代方法击败Atari街机游戏
· 创建读者自己的OpenAI Gym环境以培训股票交易代理商
· 教读者的代理使用AlphaGo Zero玩Connect4
· 探索有关主题的最新深度RL研究,包括AI驱动的聊天机器人
8. Natural Language Processing in Action