如何解决如何正确验证机器学习模型?
我对模型验证感到困惑。
我为 6 种不同算法所做的工作:
-->分离我的数据集 75/25(训练/测试)--> 测试我保持不变。
-->使用训练集我做了以下事情:
现在问题来了:
我还有一个未触及的测试集(从一开始的分裂开始),我该怎么办?直接应用到最好的模型,看看性能?还是使用整个训练集以最佳参数重新训练最佳模型,然后应用测试集?
还是这里的一切都错了?
解决方法
你明白了。这是一般规则:
- 从 6 个模型中选择最好的模型。我看到在您的情况下 K 为 4,建议为 10 或 20。
- 在所有部分上再次重新训练最佳模型(整个训练集)。 (已经通过交叉验证建立了信任)。
- 对测试集进行预测。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。