如何解决在训练之前和训练期间是否可以修改OpenAI体育馆状态?
我想做的是修改环境,例如,在超级马里奥兄弟体育馆的环境中,模糊探员训练的图像,并查看强化学习探员是否仍然能够在这些“模糊的”情况下学习。 “状态。
OpenAI是否可以做这样的事情?如何添加健身房环境的预处理步骤?
解决方法
我建议您为您的健身环境做一个包装,在step()
和reset()
函数中添加处理方法
这里有一些代码可以说明这个想法:
class EnvWrapper(gym.Env):
def __init__(self,config):
self.env = gym.make("Your-Env-Name") # The wrapper encapsulates the gym env
def step(self,action):
obs,reward,done,info = self.env.step(action) # calls the gym env methods
obs = self._blur(obs) # applies your specific treatment
return obs,info
def reset(self):
obs = self.env.reset() # same for reset
return self._blur(obs)
def _blur(self):
do_whatever_you_need
使用这种方法,您无需对原始环境进行任何更改,这通常是个好主意
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。