如何解决时间序列上的 LightGBM 模型给出了奇怪的结果减少训练数据改善结果!我的错误是什么?
我正在研究时间序列分类问题。
基于 8 个特征,我尝试使用滚动时间窗口训练模型。因此,使用 250 天的数据进行训练,然后预测第 251 天的值。然后将窗口向前滚动一天,并使用接下来的 250 天数据来预测第 252 天的值,依此类推。我正在使用 LightGBM 模型(可以在这里使用任何合奏)。
问题
-
我是否正确构建了带有滚动时间窗口的 For 循环?
-
当我用 8 个特征和 250 天的训练窗口训练模型时 - 我得到了 80% 的准确率。当我只用 1 个特征训练它(随机取一个)或使用 2 天训练窗口(即使 2 天窗口有单个类 - 1 或 0 也运行代码),我得到相同或更高的准确率,达到 86% .这不直观!这是怎么回事?
可在 https://colab.research.google.com/drive/1sQlrrSJ22OBnpCEM2oEzhQdSEK15Dy2c?usp=sharing
上找到 colab 笔记本提前感谢您的帮助
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。