微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何告诉tf_agent Epiode已终止?

如何解决如何告诉tf_agent Epiode已终止?

我正在学习强化学习,并且正在tf-agent中使用DQN教程。我将环境更改为OpenAI Gym Mountain Cart问题,发现培训代理真的很困难。我认为的可能原因是在缓冲区中,数据是逐集存储的,这意味着下一个情节的开始与上一个情节保持一致,代理可能会认为终端状态之后的状态是初始状态。状态。

我的代码在这里,可以看看吗? https://colab.research.google.com/drive/1h8oEujl61qJxj9ukBseyj4QyGLy49het?usp=sharing 预先谢谢你!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。