如何解决使用Google AutoML表的概率可信度估计
Google AutoML表用于生成具有多个输出类别的分类器时,会为每个看起来像概率的分类结果生成一个 置信度 。可以将其视为概率吗?如果是这样,产生这种可能性的方法是什么?可以为此概率计算95%的置信区间吗?
解决方法
是的,由于网络的最后一个 softmax 层,此置信度度量输出可以视为概率。
模型是否具有单类或多类输出(如您的问题所述),引擎盖下的机制依赖于映射实数的函数(sigmoid/logistic或softmax)将值从神经网络的最后一层计入归一化的概率分布,并具有相应的统计属性,使您可以将输出视为概率。
请参阅here Google培训课程中有关 softmax 层的简短说明。
回想一下,逻辑回归会产生一个介于0和1.0之间的小数。例如,电子邮件分类器的逻辑回归输出0.8表示电子邮件有80%可能是垃圾邮件,而有20%的可能性不是垃圾邮件。显然,电子邮件为垃圾邮件或非垃圾邮件的概率之和为1.0。
Softmax将此想法扩展到一个多类世界。也就是说,Softmax在多类别问题中为每个类别分配十进制概率。这些十进制概率之和必须为1.0。这种额外的限制有助于训练收敛,而不是其他情况。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。