OpenAI Gym 是一个优秀开发和比较强化学习算法的工具.
gym的核心接口是Env方法:
reset(self):重置环境的状态,返回观察。
step(self, action):推进一个时间步长,返回observation,reward,done,info
render(self, mode=’human’, close=False):重绘环境的一帧
OpenAI Gym由两部分组成:
gym开源库:测试问题集合的环境,进行游戏强化学习的测试,比如机器人玩游戏,环境的集合就是游戏的画面。
OpenAI Gym 服务是提供一个平台,允许用户对他们的测试结果进行比较,对于游戏Acrobot-v1:https://gym.openai.com/envs/Acrobot-v1)和api 的访问。
OpenAI Gym 的白皮书详情访问 arxiv.org/abs/1606.01540,
OpenAI Gym 的 GitHub 链接(https://github.com/openai/gym#installing-dependencies-for-specific-environments)
OpenAI Gym 支持多环境,获取所有环境列表 访问:https://github.com/openai/gym
OpenAI Gym 作为实践环境,这是一个可以用来研究和比较强化学习算法的开源工具包,包含了各种可用来训练和研究新的强化学习算法的模拟环境
安装
可以执行的安装:
git clone https://github.com/openai/gym.git
cd gym
pip install -e .
安装 OpenAI Gym:
pip install gym