如何解决如何使用强化学习在图中找到不同人的步行路径?
我不知道强化学习是否可行,但我的问题是在图中为不同的人寻找步行路径。我绘制的帮助问题描述的示例图像在这里:
问题在于:有一个带有图形表示的花园。黑线是花园里的步行道,红线是顶点,所以是道路的交汇点。蓝人是人,他们可以走在路上,他们只能在顶点(红点)上改变他们的路。人数不限,花园可同时容纳1人或10人以上。人们想以最短的路径到达绿色大门,但是当他们这样做时,他们不能同时在同一顶点相遇。例如,A 可以在 vertex1 中,B 可以在 vertex2 中,但他们可以一起在 vertex3 中。我为每个人绘制了粉红色的示例路径,所以我的目的是为花园中的每个人找到他们到达绿色大门的路径,而不会遇到任何人。这就像一个时间序列问题,因为每个人在单位时间内可以走到一个顶点,而且所有人的速度都是相等的。
是否有类似的问题或解决方案?或者我可以做些什么来解决这个问题?
解决方法
不是解决方案,而是建议,https://gym.openai.com/ 有类似的问题及其解决方案。我曾在 https://gym.openai.com/envs/FrozenLake-v0/ 这个环境中使用过一次基本实现的 q-learning,但在这个环境中与一个代理(人)一起工作。你可能想看看这个。进一步研究蚁群和粒子群优化算法。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。