微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

对于不平衡的二元分类模型,我应该使用哪个指标?

如何解决对于不平衡的二元分类模型,我应该使用哪个指标?

我在不平衡数据集上执行了 SVM,以 70/30 拆分训练/测试。训练集中的实例数为class 11163993class 0234190个实例。对于测试集,我有 498699class 1 实例和 100189class 0 实例。 SVM 的混淆矩阵如下所示:

我应该使用什么指标来评估模型?以这种方式使用 f-avg,计算每个类的精度、召回率和 f-1 分数可能是一种解决方案:

enter image description here

然后通过对每个班级计算的两个 f-1 分数的算术平均值计算 f-avg,如上表的最后一行所示?

解决方法

我假设您正在此处寻找概率评估指标。在我看来,使用 AUC-ROC(使用精度和召回率计算)将是正确的方法,实际上对于大多数二元分类问题。

另请参阅this article

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。