如何解决将图像注释格式转换为 tfrecords 用于 tensorflow 对象检测 api
寻求有关对象检测 API 的图像注释格式的帮助。
- 预知:
因为,我们知道图像有两种注释格式,Pascal VOC 和 COCO 格式。两者都有自己的规范,这是两者之间的主要区别:
帕斯卡 VOC:
- 以 .xml 文件格式存储注释。
- 边界框格式 [x-top-left,y-top-left,x-bottom-right,y-bottom-right]
- 为数据集中的每个图像创建单独的 xml 注释文件。
可可:
- 当前问题:
我有两个数据集要处理,这就是它们的注释方式。
数据集 1:
数据集 2:
我无法通过的是我应该遵循哪种格式(Pascal VOC 或 COCO)将我的注释转换为 Tfrecords(.xml 到 .records),因为使用可以看到数据集的注释不是纯粹属于任何一种格式。
例如,在 this link 中,作者编写了一个脚本将 .xml 转换为 .records,但这里处理的是纯 pascal VOC 格式。
在 this link 中,他们处理的是纯 COCO 注释格式。
当我站在两种格式的中间时,我应该走哪条路?
解决方法
当我站在两种格式的中间时,我应该走哪条路?
-
使用 Pascal VOC 格式将 .xml 转换为 .records。
-
在 this link 的
Tk()
函数中进行以下更改create_tf_example
如果您的 .xml 注释中有 X、Y、宽度、高度而不是 xmin、ymin、xmax、ymax。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。