如何解决交叉验证和网格搜索 CV
大多数关于 ML 的文章都指出,使用 k 折交叉验证方法在看不见的数据上生成模型性能的稳健指标已成为普遍做法,比经典的训练-测试拆分方法更是如此。
但是,如果您在创建模型时使用网格搜索交叉验证进行超参数调整,是否仍然可以在之后使用交叉验证作为生成此类度量的方法?
我(有限)的理解是,在 CV 的每个折叠中使用的测试集将不再真正“看不见”,因为它们已经对超参数调整步骤做出了贡献。
然而,如果您首先进行经典的训练测试拆分,并且仅在网格搜索步骤中使用此训练集,那么您将在测试集的未见数据上获得更独立的模型度量,因为它未在测试集中使用超参数调整。
如果我打算使用网格搜索,或者我在这里遗漏了什么,我应该继续使用列车测试分组吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。