如何解决深度学习:如何处理输入大小的变化
我想做一个回归任务(在一些大小约为 150x 70 像素的图像中找到对象的 x、y 位置)。因此,我有大约 2000 张带注释的图像(我可以注释更多,最多可达 20000 张)。我的第一个想法是使用 CNN,但输入数据的大小不一致,我不想通过调整大小或裁剪图像来丢失特征。你怎么认为? 还有比使用 CNN 更好的方法吗?我如何处理这种图像大小的变化?
解决方法
好的,这就是事情,如果您不想重新缩放或裁剪。那么你将无法进行批处理。
您可以将输入图像缩放为一种尺寸。只需确保您的所有训练图像大小相同,并且需要对地面实况(边界框)进行类似的转换。
大问题:我不想将变换应用于边界框,而且操作起来很复杂?
这是一个简单的库 Albumentations,可以为您完成所有这些。你不必担心数学- 图书馆 - https://github.com/albumentations-team/albumentations
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。