如何解决ValueError:当目标包含负值时,不能使用均方对数误差
cross_val_score(estimator=LinearRegression(),X=X,y=y,scoring='neg_mean_squared_log_error',cv=5)
导致以下错误:
ValueError: Mean Squared Logarithmic Error cannot be used when targets contain negative values.
即使我的目标向量没有负值(房价)
>>> np.any(y < 0)
False
我知道未为负值定义log函数,这意味着对数平方误差使用以下公式:
这意味着问题一定出在哪里,即在拟合线性回归预测为负值之后,情况并非如此:
>>> np.any(LinearRegression().fit(X,y).predict(X) < 0)
False
我已经阅读了类似问题的答案,但是我仍然不确定是什么导致了此错误以及如何解决该错误。使用交叉验证时,其他正则化线性回归器(例如Ridge,Lasso,ElasticNet)也会发生相同的错误。但是当我使用
mean_squared_log_error(y,model.fit(X,y).predict(X))
使用这些相同的模型,即找到训练分数,它完美地运行而没有错误。
我的目标是在kaggle上提交预测。他们使用均方根对数误差来评估性能,但是如果我的预测有时为负,那么kaggle如何使用该指标来计算出分数?
与其他评分器(例如neg_mean_squared_error)进行交叉验证时
cross_val_score(estimator=LinearRegression(),scoring='neg_mean_squared_error',cv=5)
当然没有问题,所以我可以使用带有此度量的交叉评估值来评估我的模型的性能,即neg_mean_squared_error最低的模型是否也具有neg_mean_squared_log_error最低的模型?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。