微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

随机森林校准

如何解决随机森林校准

我正在尝试使用随机森林来解决分类问题,并且想知道单个特征的校准。例如,体育赛事中的主场优势等 2 级因素,我们可以肯定它对胜率的平均影响约为 +5%,并且数据中的任何其他特征都没有捕捉到它的影响。

似乎随机森林的性质(在每次拆分时选择 N 个随机特征来考虑)似乎不允许模型完全捕捉这样的任何一个特定特征的影响。将 max_features 参数设置为 None 或包含所有特征似乎可以解决问题,但随后就失去了树之间多样性的能力。

我想知道是否有任何好的方法可以根据我们对问题的某种领域知识来处理我们希望完全捕获的此类特征?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。