微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

将图像注释格式转换为 tfrecords 用于 tensorflow 对象检测 api

如何解决将图像注释格式转换为 tfrecords 用于 tensorflow 对象检测 api

寻求有关对象检测 API 的图像注释格式的帮助。

  • 预知:

因为,我们知道图像有两种注释格式,Pascal VOC 和 COCO 格式。两者都有自己的规范,这是两者之间的主要区别:

帕斯卡 VOC:

  1. 以 .xml 文件格式存储注释。
  2. 边界框格式 [x-top-left,y-top-left,x-bottom-right,y-bottom-right]
  3. 为数据集中的每个图像创建单独的 xml 注释文件

可可:

  1. 以 .json 文件格式存储注释。
  2. 边界框格式 [x-左上角、y-左上角、宽度、高度]。
  3. 为每个训练、测试和验证创建一个注释文件
  • 当前问题:

我有两个数据集要处理,这就是它们的注释方式。

数据集 1:

  • 文件格式:Pascal VOC(.xml)
  • 边界框格式:COCO。
  • 文件创建:如 Pascal VOC(数据集中每个图像的单独 xml 注释文件)。

数据集 2:

  • 文件格式:Pascal VOC(.xml)
  • 边界框格式:COCO。
  • 文件创建:如在 COCO 中(为每个训练、测试和验证创建一个注释文件

我无法通过的是我应该遵循哪种格式(Pascal VOC 或 COCO)将我的注释转换为 Tfrecords(.xml 到 .records),因为使用可以看到数据集的注释不是纯粹属于任何一种格式。

例如,在 this link 中,作者编写了一个脚本将 .xml 转换为 .records,但这里处理的是纯 pascal VOC 格式。

this link 中,他们处理的是纯 COCO 注释格式。

当我站在两种格式的中间时,我应该走哪条路?

解决方法

当我站在两种格式的中间时,我应该走哪条路?

  1. 使用 Pascal VOC 格式将 .xml 转换为 .records。

  2. this linkTk() 函数中进行以下更改

    create_tf_example

如果您的 .xml 注释中有 X、Y、宽度、高度而不是 xmin、ymin、xmax、ymax。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。