微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

与缺少预测变量值的输入数据相比,partikit Forecast返回的行更少

如何解决与缺少预测变量值的输入数据相比,partikit Forecast返回的行更少

我对根据缺失值的数据训练的partikit加权条件树模型有问题。

我正在通过在每个周期为观察值赋予不同的整数权重来手动创建袋装树模型。

但是当我使用自举模型进行预测时,我注意到其中一些返回的值小于输入数据行。有趣的是,在输入数据的299行中,预测的数据长度为299或289。289是在删除具有缺失数据的预测变量之后的行数。

深入研究问题,我发现它是由三个组件的相互作用引起的:

  • 在模型中使用权重;
  • 预测变量中缺少数据;
  • 在传递给predict()的输入数据中使用字符变量代替因子

如果仅缺少这三个条件之一,就不会出现问题,并且所有树都将返回299值。

以下是数据:https://www.dropbox.com/s/98oriv2msce4wu5/anonym_data.rds?dl=0 这是重现该问题的脚本:https://www.dropbox.com/s/5y7g2dwt2838pbp/test.R?dl=0

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。