如何解决python中的OOB分数和交叉验证
使用SKLearn的RandomForestRegressor在一个集合(数据)的'sales'列上建立一个随机森林,我如何找到拟合后的out-of-bag error;和python中的交叉验证分数?我在努力
from sklearn.ensemble import RandomForestRegressor
rlf = RandomForestRegressor(n_estimators=100,max_depth=None,max_features='auto',max_samples=None,oob_score=False)
rlf.fit(data,data['sales'])
rlf.oob_score_(data,data['sales'])
解决方法
不清楚你需要什么,如果你想要一个oob分数(R^2),你可以这样做:
from sklearn.ensemble import RandomForestRegressor
rlf = RandomForestRegressor(oob_score=True,random_state=11)
from sklearn.datasets import load_boston
X,y = load_boston(return_X_y=True)
rlf.fit(X,y)
rlf.oob_score_
0.8694467927166596
如果你想计算另一个分数,你有 oob 预测:
from sklearn.metrics import mean_squared_error
mean_squared_error(y,rlf.oob_prediction_)
11.021243813623474
对于交叉验证,您需要 cross_validate
,默认情况下为 r2 :
from sklearn.model_selection import cross_validate
scores = cross_validate(rlf,X,y)
你也可以这样做:
scores = cross_validate(rlf,y,scoring='neg_mean_squared_error')
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。