微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

RandomForestClassifier 如何进行分类?

如何解决RandomForestClassifier 如何进行分类?

我了解到 Sklearn 将多类分类问题视为二元问题的集合。引用 Sklearn 用户指南:

在将二元度量扩展到多类或多标签问题时,数据被视为二元问题的集合,每个类一个

因此,LogisticRegression支持向量矩阵等二元分类模型可以通过使用一对一或一对一策略来支持多类案例。我想知道 RandomForestClassifier 是否也是这种情况? Sklearn 中的其他分类器如何 - 在处理多类问题时,它们是否都用作二元分类器?

解决方法

根据 Decision Trees 的文档,多输出问题会为随机森林中的每棵树的叶子添加一个小的变化。

假设您已设置 criterion='gini'。本质上,每个节点都是通过选择 max_features 特征的子集,计算所有 N 类基尼杂质的平均减少量并选择减少量最大的可变阈值组合来构建的。

这意味着随机森林不会为每个类别创建一个模型。相反,它只是一个模型,可以同时减少每棵树每个节点中所有类的标准度量,并预测每个叶子上最常见的类。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。