OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已经成为了领域标准。目前,在 Gym 的项目主页,Star 量已经达到了 26.6k。
项目地址:https://github.com/openai/gym近日,Gym 迎来了迄今为止最大的更新,包括 API 变化、环境变化和其他变化。env.reset 接受 3 个新的参数(options - 对于无再次初始化环境时控制课程学习等操作有用;seed - 未来环境 seed 可以传递到 reset 参数。老的 .seed() 方法被弃用,但考虑到向后兼容,该方法在 Gym 1.0 发布之前仍继续如常工作;infos - 当设置为 True,reset 将返回 obs, info。当前这种做法默认为 False,但将变成 Gym 1.0 版本的默认行为);
环境名称在注册期间不再需要一个版本,并将智能推荐类似名称;
Vector 环境支持 info 中的 terminal_observation 并支持批处理操作空间。
blackjack 和 frozen lake 示例环境现在使用 PyGame 进行了更好的图形渲染;
机器人环境已移动到 gym-robotics 包中;
bipedal walker 和 lunar lander 环境现在被合并称为一类;
Atari 环境现在使用标准种子 API 了;
修复了 car_racing box2d 环境中的大错误修复,碰撞版本;
重构了所有 box2d 和 classic_control 环境,以使用 PyGame 而不是 Pyglet。因为 pyglet 的问题一直是 gym 项目生命周期中最常见的 GitHub 问题来源之一。
公众号后台回复“数据集”获取30+深度学习数据集下载~
备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)
即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群
每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~
觉得有用麻烦给个在看啦~