如何解决使用极其有限但准确的训练数据进行对象检测
快速总结:
我正在尝试训练一个对象检测算法来检测大量不同的对象(200 多个),训练数据极其有限,希望通过一个极其简单的输入范围可以抵消这个问题的难度。
我有每个对象的单个图像,然后我需要在输入图像中找到这个确切的子图像存在的位置。
我一直在尝试让 YOLOv5 正常工作,但在 Windows 上运行时遇到了很多问题,在我开始尝试让它在 docker 容器中运行之前,我想确认一下我实际上是使用正确的工具完成工作。
更深入的解释:
我玩一个游戏(逃离塔科夫),其 UI 如下所示:
右边网格中的物品在游戏物品中。我希望对象检测算法截取屏幕截图并返回清单中的项目列表,然后由我的程序的另一部分使用。
我拥有的训练数据只是每个类的 onje 图像,它是每个项目的游戏内表示,看起来像这样(这是我拥有的库存顶部 Cord 的训练数据):
我担心这是尝试使用错误的工具来完成这项工作,但我不确定什么会更好。我以为我使用了简单的子图像检测,但是 a) 我不确定哪些库对这个用例有好处,b) 我担心随着战利品范围的增加,检测速度会下降(我希望这尽可能接近实时)。使用基于机器学习的方法的原始计划是以 ONNX 格式导出网络,以便通过 ML.Net 将网络包含到 .net 应用程序中。任何建议都会非常有帮助。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。