微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

用新数据重新训练分类器会产生大量的类变化

如何解决用新数据重新训练分类器会产生大量的类变化

我每天都在 15 万条记录上训练 XGBoost 二进制分类器。 每天,大约有 500 条记录添加到训练集。 测试集(推理)10M 记录,无标签。 我注意到连续几天训练的两个模型对相同的记录(高达 10% 的推理数据)产生了根本不同的预测。 我现在尝试过的:

  1. 设置相同的种子和参数。
  2. 不同的分类器。

我担心的是,该模型的泛化程度不够,因此每日预测会发生重大变化。 我很想知道解决这个问题的可能方法

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。