如何解决UNET 与简单的自动编码器有何不同?
UNET 架构就像前半编码器和后半解码器。自动编码器有不同的变体,如稀疏、变分等。它们都压缩和解压缩数据,但 UNET 也同样用于压缩和解压缩。就我而言,我认为在简单的自动编码器中我们不使用 Transpose2D 卷积,但在 UNET 中我们使用这种上采样。在简单的自动编码器中,我们不使用 Transpose2D Conv。上采样是如何发生的,如果我们在自动编码器中使用 Transpose2D,它与 UNET 有何不同?
解决方法
我认为 U-Nets
和纯 Encoder-Decoder Networks
之间存在重要区别。
在 encoder-decoder
网络中,只有一个潜在空间 (L) 具有从输入 (X) 到该空间的非线性映射(编码器:X->L),以及从该潜在空间到输出空间的对应映射(解码器:L->Y)。
编码器和解码器之间有明显的区别:encoder
将每个样本的表示更改为潜在空间中的某些“代码”,而 decoder
能够仅在给定这些代码的情况下构造输出.这意味着您可以拆开这样的网络并分别使用 encoder
和 decoder
。
在 U-Nets
中,情况并非如此。在那里,输出映射也直接取决于输入空间 - 不是 L->Y,而是 [X+L]->Y(“跳过”连接)。这意味着没有真正的“编码器”和“解码器”部分,从将样本映射到一些明确定义的潜在空间然后计算其输出的意义上说。
您不能将 U-Net
拆分成多个部分并单独使用它们,因为为了计算输出,还需要输入 - 以及它的所有中间表示(因为在U-Net:X->L1->L2->...->Ln)
亲切的问候,
Niek Tuytel
,在自动编码器中,编码部分对输入进行线性压缩,这会造成瓶颈,无法传输所有特征。另一方面,U-Net 在上采样端进行反卷积,克服了由于架构的编码器端的连接而丢失特征的瓶颈问题(扩展路径与收缩路径对称) .通过这样做,U-Net 的上采样部分包含大量特征通道,这允许网络将上下文信息传播到更高分辨率的层。
,瓶颈不是问题,也没有克服……U-net 用于特定任务,如分割,其中自动编码器用于其他任务,如重建、生成、去噪等。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。