如何解决训练/测试的 OOB 分数、准确性和 f1 分数
我对此很陌生,而且相当困惑。我正在用随机森林(分类)训练我的模型,并试图完全掌握以下概念。
据我所知:您使用训练/测试拆分或交叉验证或 oob(引导方法)拆分模型 . 然后,准确率分数或 f1 分数代表您的模型在测试集上的表现(准确率对于平衡类更好,f1 对于不平衡类更好)。
但是,OOB 分数代表您的验证集有多好,那么模型在您的数据上的训练效果如何?
我在这里误解了什么吗?
我对准确率/f1 分数和 OOB 分数之间的差异感到困惑。
任何输入将不胜感激
解决方法
这是您正在关注的 2 个不同方面:
-
指标,这些是您用来评估模型在一组数据上的表现的数学公式,因此您需要为其提供基本事实(真实标签)和预测标签,而指标分数是计算,这些指标包括:
- 准确性
- 精度
- 回忆
- F1
- MSE
- 等
-
方差减少,这些是您用来减少模型方差的方法,即:防止模型过度拟合数据,这些方法包括:>
- 使用 2 个不同的集合(即训练/测试拆分)
- 交叉验证(例如 K 折交叉验证、LOOCV 等)
- Out of Bag,这个特别用于随机森林算法,以引导用于集成(森林)中每个学习者的数据。
- 等
因此,基本上,您使用一种方法来尝试减少模型的方差,从而改进指标。
至于您的具体问题:OOB 分数与准确度分数的关系是什么? OOB 算法创建用于训练的数据子集,然后根据这些子集的预测标签使用指标计算得分。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。