什么时候微观和宏观平均差异很大？

我正在学习机器学习理论。我有一个使用多类逻辑回归的预测混淆矩阵。

现在我已经计算了微观和宏观平均值（准确率和召回率）。

价值完全不同。现在我想知道哪些因素会影响这一点。什么情况下会出现微观和宏观差异大？

我注意到不同类别的预测准确度不同。这是原因吗？或者还有哪些其他因素会导致这种情况？

样本混淆矩阵：

以及我计算出的微观宏观平均值：

precision-micro = ~0.7329
recall-micro = ~0,7329

precision-macro = ~0.5910
recall-macro = ~0.6795

微观和宏观平均值之间的差异在不平衡的数据集中变得明显。

micro 平均值是一种全局策略，基本上忽略了类之间的区别。它是通过计算所有类别的总真阳性、假阴性和假阳性来计算的。

在潜在问题不是多标签分类的分类任务中，微观平均值实际上等于准确度分数。看到您的微精度和召回率相等。计算准确度分数并进行比较，您将看不到任何差异。

在 macro 平均值的情况下，分别计算每个标签的精度和召回率，并报告为它们的未加权平均值。根据您的分类器在每个类上的表现，这可能会严重影响结果。

您也可以参考我的这个 answer，这里已经更详细地解决了这个问题。