微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

TensonFlow 2 分布式Impala 强化学习策略

如何解决TensonFlow 2 分布式Impala 强化学习策略

我正在尝试实施 IMAPLA 算法(强化学习)

在这个算法中有许多actor,它们使用他们的神经网络执行动作并将轨迹发送给学习器。 学习者拥有与所有演员相同的神经网络,它训练神经网络,并在进行一些学习后将更新的权重分配给所有演员

我想了解哪种分发策略更适合此任务。我的理解是镜像策略参数在所有机器上共享,但在这里我们不需要它,那么我应该使用哪一个

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。