如何解决Keras中YOLOv3的模型设计和输出结构应该是什么? 如何将金字塔地图连接到 Y 标签单出或多出模型?
请不要建议使用 GitHub 存储库并使用预先构建的模型(我正在努力学习)。
我在理论上对 YOLOv3 有这种理解,我认为我可以构建卷积层网络、跳过连接、深度明智的内核、上采样等等。所以我可以使用以下组件:
upsampled = tf.keras.layers.Conv2DTranspose()(prev_layer)
类似地,我可以使用 tf.keras.layers.concatenate(prev_layer,layer_61)
获得 Conv 结果的添加和合并。或在需要时按 tf.keras.layers.Add()([prev_layer,residual_output])
进行添加。
以这种方式堆叠层没什么大不了的。任何人都可以做到这一点。主要的问题是我不知道多金字塔这个词到底是怎么回事? 3层将输出13x13x255
、26x26x255
和52x52x255
。但我只有原始图像的相应 y label
。我需要做什么?我是否必须插入 3 个输出模型并执行 model(inputs=input_image,outputs=[map_13,map_26,map_51])
然后使用 3 个不同的损失?还是只使用 1 个输出?将我的 y_labels
重新缩放或重新调整为较小的图像? 究竟如何)
此外,无论如何,我将如何获得预测?人们把这个话题挂在博客和视频上,没有人知道推理是如何运作的。请帮忙。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。