交叉验证后的逆变换 RMSE 分数

如何解决交叉验证后的逆变换 RMSE 分数

我正在尝试将 sklearn 的 cross_val_score 输出的 rmse 分数重新调整为预测数据的原始单位。我已经使用预测数据和实际数据手动计算了均方根误差,我使用 inverse_transform 重新调整了预测和实际数据之前计算均方根误差。这给了我大约 2.5 的 RMSE。这是对我的测试集的预测。

然后我使用来自 sklearn 的 cross_val_score,其中 cv=10,生成一个按比例缩放的 RMSE 值列表。我想将这些值重新调整回原始单位。当我通过使用 inverse_transform 或通过手动乘以 stdev 并添加平均值来执行此操作时,我得到的值比我之前在测试集上得到的 rmse 大十倍左右,我在计算 rmse 之前在该测试集上进行了 inverse_transformed。我在这里做错了什么?我原以为训练集交叉验证的结果会更低。

我的代码如下:

atts_test 是我预测的测试数据属性

test_set_predictions = forest_reg.predict(atts_test)

#Convert back to original units after using scaled data
test_set_predictions = scaler_labels.inverse_transform(test_set_predictions)
labels_test = scaler_labels.inverse_transform(labels_test)
#Make 1D list
labels_test = labels_test.reshape(-1)

print("Proper units predictions: ")
print(test_set_predictions)
print("Proper units actual: ")
print(well_labels_test)

forest_mse = mean_squared_error(labels_test,test_set_predictions)
print("RMSE: " + str(np.sqrt(forest_mse)))

这给出了 2.58。然后我对训练数据使用 cross_val_score,并尝试对这些 rmse 值使用我的标签缩放器。

from sklearn.model_selection import cross_val_score

scores = cross_val_score(forest_reg,train_atts,np.ravel(train_labels),scoring="neg_mean_squared_error",cv=10)

rmse_scores = np.sqrt(-scores)
print(scaler_labels.inverse_transform(rmse_scores))

这给出了大约 22 的值。我觉得这太高了。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?