如何改进回归？ - 编程之家

我想问一下是否有任何方法可以使回归真正适用于我的数据集。

我的问题是，在我使用随机森林或 SVM 回归器训练数据后，它在训练数据集中运行得很好，但是当我尝试使用测试数据集时，它显示出非常糟糕的结果......即使它们具有相同的基本方程。

我真的不知道如何改进这一点。这是否意味着我应该继续用更多数据集训练我的回归？

有人可以帮我吗？ :(

你想训练和测试什么样的数据集会更好......例如维度、# 项等。有多种原因，但万一，通常训练失败

这只是我的想法，但作为回归器，SVM 或其他基于树的模型（如随机森林/决策树）在数据集较小时有点不稳定。如果维数小于 10，我建议使用高斯过程回归器。

并且真的建议在尝试训练/测试任何模型之前对数据集进行标准化/正则化。

仅供参考，以下是我刚刚搜索的链接。

我们无法回答您的问题。您甚至不尝试提供数据或您的代码。怎么能知道为什么会出现您的问题。

我的两分钱：