微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何改进回归?

如何解决如何改进回归?

我想问一下是否有任何方法可以使回归真正适用于我的数据集。

我的问题是,在我使用随机森林或 SVM 回归器训练数据后,它在训练数据集中运行得很好,但是当我尝试使用测试数据集时,它显示出非常糟糕的结果......即使它们具有相同的基本方程。

我真的不知道如何改进这一点。这是否意味着我应该继续用更多数据集训练我的回归?

有人可以帮我吗? :(

解决方法

你想训练和测试什么样的数据集会更好......例如维度、# 项等。 有多种原因,但万一,通常训练失败

  1. 训练集规模小
  2. 领域空间太大而无法学习/非常非凸/非常非线性
  3. 模型参数不合适

这只是我的想法,但作为回归器,SVM 或其他基于树的模型(如随机森林/决策树)在数据集较小时有点不稳定。如果维数小于 10,我建议使用高斯过程回归器。

并且真的建议在尝试训练/测试任何模型之前对数据集进行标准化/正则化。

仅供参考,以下是我刚刚搜索的链接。

,

我们无法回答您的问题。您甚至不尝试提供数据或您的代码。怎么能知道为什么会出现您的问题。

我的两分钱:

  1. 训练和测试数据不平衡吗? -> 这是测试结果不好的主要原因

  2. 样本是否足够大?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。