微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

将BCE损失用于图像的变分自动编码器的背后是什么?

如何解决将BCE损失用于图像的变分自动编码器的背后是什么?

我只是实现变分自动编码器,想知道将BCE损失用于RGB图像的背后是什么。

据我了解,对于MNIST数据集,标准VAE正在为所有像素重建伯努利分布参数。从该模型得出的重建误差为

p(x)=Πx i y i (1-x i ( 1-y i

采用负对数形式,可以通过以下方式得出BCE;

BCE(x)= -logp(x)=Σ(-y i logx i -(1-y i )log (1-x i ))

其中x是整个输入向量,x i 是其像素,其中i在[0,width * height)。

我想知道如何将其应用于彩色图像。由于单色0/1值图像后面的概率模型是每个像素的伯努利分布,因此该模型无法应用于值为0到255的彩色图像。通过将图像重新缩放为连续的0到1值将不会没有帮助。使用BCE损失背后的数学原理是什么?

我看到this

...当y = p时,即当真实标签等于预测标签时,二进制交叉熵具有最小值,这正是我们要寻找的。​​ p>

但是对于这种情况背后的概率模型仍然感到困惑。而且,有些代码using BCE,有些代码using MSE,无法理解使用这些损失的原因。

谢谢!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。