微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

什么时候微观和宏观平均差异很大?

如何解决什么时候微观和宏观平均差异很大?

我正在学习机器学习理论。我有一个使用多类逻辑回归的预测混淆矩阵。

现在我已经计算了微观和宏观平均值(准确率和召回率)。

价值完全不同。现在我想知道哪些因素会影响这一点。什么情况下会出现微观和宏观差异大?

我注意到不同类别的预测准确度不同。这是原因吗?或者还有哪些其他因素会导致这种情况?

样本混淆矩阵:

enter image description here

以及我计算出的微观宏观平均值:

precision-micro = ~0.7329
recall-micro = ~0,7329

precision-macro = ~0.5910
recall-macro = ~0.6795

解决方法

微观和宏观平均值之间的差异在不平衡的数据集中变得明显。

micro 平均值是一种全局策略,基本上忽略了类之间的区别。它是通过计算所有类别的总真阳性、假阴性和假阳性来计算的。

在潜在问题不是多标签分类的分类任务中,微观平均值实际上等于准确度分数。看到您的微精度和召回率相等。计算准确度分数并进行比较,您将看不到任何差异。

macro 平均值的情况下,分别计算每个标签的精度和召回率,并报告为它们的未加权平均值。根据您的分类器在每个类上的表现,这可能会严重影响结果。

您也可以参考我的这个 answer,这里已经更详细地解决了这个问题。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。