微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何从多类公共数据集中为目标类选择带注释的数据以进行对象检测模型训练以创建 TFrecord 文件?

如何解决如何从多类公共数据集中为目标类选择带注释的数据以进行对象检测模型训练以创建 TFrecord 文件?

我正在尝试使用 tf2 object detection API 构建对象检测模型。 我有两个带有多类边界框注释的公共数据集 (注释采用 Pascal-VOC .xml 格式) 我希望从中创建仅用于选择性类的模型。

例如:

  • Dataset1 有类 ['Tiger','Cat','Leopard']
  • Dataset2 有类 ['Car','Auto'。 '自行车']

现在,我的目标类['Tiger','Car']

我的问题是使用具有目标类的数据创建 TFrecord 文件的最佳方法是什么?

另外,我这边的一些愚蠢的解决方案,有可能吗?

  1. 将两个数据集合并为一个数据集。
  2. 拆分为训练测试。
  3. 使用我的目标类创建一个 labelmap.pbtxt。
  4. 生成训练和测试 TFRecord 文件时,参考我的目标标签图类解析和选择注释信息。

解决方法

这是您问题的答案。 如果您使用 generate_tfrecord.py 脚本,只需将您的目标类添加到 this function,您的模型将只针对这些类进行训练,并且会忽略注释文件中的其他标记类。

  1. 您可以将两个数据集合并为一个数据集,但是当 Dataset1 对象存在于 Dataset2 中时可能会出现问题,并且它们将在那里未注释并且模型会将它们视为背景,反之亦然。
  2. 是的,您可以拆分它们。
  3. 是的,您可以创建 labelmap.pbtxt

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。