微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何将我的模型应用于 WEKA 中的新数据集?

如何解决如何将我的模型应用于 WEKA 中的新数据集?

我根据提供给我的数据集创建了一个新的预测模型。它根据多个数值属性预测名义(二进制)类属性(正/负)。

现在我被要求使用这个预测模型来预测新数据集的类别。除了尚不存在的 class 列之外,该数据集具有所有相同的属性。如何将我的模型应用于这些新数据?我尝试向我的新数据集添加一个空类列,然后执行以下操作:

  • 只需在 WEKA 的资源管理器中加载新数据集并加载模型。它告诉我没有训练数据。
  • 在 WEKA 的资源管理器中打开我的训练集,然后打开我的训练模型,然后选择我的新数据作为“提供的测试集”。它运行但不输出任何预测。

我应该注意到,在对训练数据进行交叉验证测试时,该模型运行良好。它也适用于我很久以前分离的用于测试/评估的训练数据子集。我认为这可能是我添加新类列的方式有问题,也许?

解决方法

为了进行预测,Weka 需要两个数据集,训练数据集和预测数据集,具有完全相同的结构,直到标签顺序。这也意味着,您需要有一个带有正确标签的类属性。对于类属性的值,只需使用缺失值(用问号表示)。

有关如何进行预测的更多信息,请参阅 Weka wiki 上的常见问题解答 How do i make predictions with a trained model?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。