微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用最小二乘法v/s sklearn回归方法时要选择的样本?

如何解决使用最小二乘法v/s sklearn回归方法时要选择的样本?

在使用 sklearn 线性回归库时,当我们使用 traintestsplit 拆分数据时,我们是否必须使用 OLS 的训练数据(最小二乘法),或者我们可以使用 OLS 方法的完整数据并推导出回归结果。

解决方法

数据科学家作为初学者会犯很多错误,其中之一就是在学习过程中使用测试数据,请看here中的这张图: enter image description here

如您所见,数据在训练过程中是分开的,以这种方式保持这一点非常重要。

现在您问的问题是关于最小二乘法,虽然您可能认为通过使用完整数据来改进过程,但您忘记了评估部分,这会更好,而不是因为回归更好。这更好,因为您已经向模型展示了您用来测试它的数据。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。