技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

将图像注释格式转换为 tfrecords 用于 tensorflow 对象检测 api

时间：2022-05-04分类：编程问答

如何解决将图像注释格式转换为 tfrecords 用于 tensorflow 对象检测 api

寻求有关对象检测 API 的图像注释格式的帮助。

预知：

因为，我们知道图像有两种注释格式，Pascal VOC 和 COCO 格式。两者都有自己的规范，这是两者之间的主要区别：

帕斯卡 VOC：

以 .xml 文件格式存储注释。
边界框格式 [x-top-left,y-top-left,x-bottom-right,y-bottom-right]
为数据集中的每个图像创建单独的 xml 注释文件。

可可：

以 .json 文件格式存储注释。
边界框格式 [x-左上角、y-左上角、宽度、高度]。
为每个训练、测试和验证创建一个注释文件。

当前问题：

我有两个数据集要处理，这就是它们的注释方式。

数据集 1：

文件格式：Pascal VOC(.xml)
边界框格式：COCO。
文件创建：如 Pascal VOC（数据集中每个图像的单独 xml 注释文件）。

数据集 2：

文件格式：Pascal VOC(.xml)
边界框格式：COCO。
文件创建：如在 COCO 中（为每个训练、测试和验证创建一个注释文件）

我无法通过的是我应该遵循哪种格式（Pascal VOC 或 COCO）将我的注释转换为 Tfrecords（.xml 到 .records），因为使用可以看到数据集的注释不是纯粹属于任何一种格式。

例如，在 this link 中，作者编写了一个脚本将 .xml 转换为 .records，但这里处理的是纯 pascal VOC 格式。

在 this link 中，他们处理的是纯 COCO 注释格式。

当我站在两种格式的中间时，我应该走哪条路？

解决方法

当我站在两种格式的中间时，我应该走哪条路？

使用 Pascal VOC 格式将 .xml 转换为 .records。
在 this link 的 Tk() 函数中进行以下更改
```
create_tf_example
```

如果您的 .xml 注释中有 X、Y、宽度、高度而不是 xmin、ymin、xmax、ymax。

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

小编推荐

苹果市值2025年有望达4万亿美元