如何解决对象检测模型的性能上下跳跃
我正在训练一个模型,用于从非洲农村的卫星图像中检测建筑物。对于标签,我使用OpenStreetMap几何。我使用Tensorflow对象检测API和SSD Inception V2作为模型,并且使用默认配置文件。我在两个不同的数据集(在不同的地理区域)上训练了单独的模型。在一个方面,模型的行为就像我期望的那样:
请注意,我使用的模型,配置,批次大小完全相同,训练区域的大小相同,等等。在第二种情况下,模型的预测变化非常迅速,我不知道为什么。例如,这是模型在107k和108k全局步长时所做的预测的比较(即,我希望这些预测是相似的):
我对深度学习非常陌生,无法理解为什么会发生这种情况。我可能忽略了一些简单的事情。我检查了标签,他们还可以。另外,我认为这可能是一个糟糕的批次,每个时期都会使训练朝错误的方向发展,但事实并非如此-性能会下降多达几个时期。
我非常感谢您在哪里查找提示,等等。我正在使用TF 1.14。
让我知道是否应该提供更多信息。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。