如何解决如何改进回归?
我想问一下是否有任何方法可以使回归真正适用于我的数据集。
我的问题是,在我使用随机森林或 SVM 回归器训练数据后,它在训练数据集中运行得很好,但是当我尝试使用测试数据集时,它显示出非常糟糕的结果......即使它们具有相同的基本方程。
我真的不知道如何改进这一点。这是否意味着我应该继续用更多数据集训练我的回归?
有人可以帮我吗? :(
解决方法
你想训练和测试什么样的数据集会更好......例如维度、# 项等。 有多种原因,但万一,通常训练失败
- 训练集规模小
- 领域空间太大而无法学习/非常非凸/非常非线性
- 模型参数不合适
这只是我的想法,但作为回归器,SVM 或其他基于树的模型(如随机森林/决策树)在数据集较小时有点不稳定。如果维数小于 10,我建议使用高斯过程回归器。
并且真的建议在尝试训练/测试任何模型之前对数据集进行标准化/正则化。
仅供参考,以下是我刚刚搜索的链接。
- https://statmodeling.stat.columbia.edu/2015/01/29/six-quick-tips-improve-regression-modeling/
- https://www.jigsawacademy.com/5-super-tips-to-improve-your-linear-regression-models/
我们无法回答您的问题。您甚至不尝试提供数据或您的代码。怎么能知道为什么会出现您的问题。
我的两分钱:
-
训练和测试数据不平衡吗? -> 这是测试结果不好的主要原因
-
样本是否足够大?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。