如何解决使用交叉验证时如何计算预测区间在 R 中?
我想为我的回归模型找到预测区间。这是一个多元自适应回归样条 (MARS) 模型。
R 中的 earth 包提供了一个方差模型来估计预测区间。但是,我不清楚这里的正确程序是什么。我的观察相对较少,因此最终没有单一的测试集来评估性能。在第一步中,我使用交叉验证(在 caret 包中)来确定最佳超参数并估计预测误差(在我的情况下为 RMSE)。之后,我可以使用在完整输入数据集上估计的最终模型来估计预测间隔。但是,我觉得这样我会得到有偏见的结果,因为我没有估计未见数据的预测区间。
这里的合法方法是什么?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。