微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

实现列表学习排序算法时面临的问题

如何解决实现列表学习排序算法时面临的问题

我正在尝试使用学习排名算法来训练我的模型以解决项目排名问题。目前为此目的使用 scikit-learn LightGBM。 完成了一些初始步骤,但我不确定该过程是否正确。

  1. 我的项目 ID 在我的场景中被转换为 pid。
  2. 我的数据是 csv 格式,因此将其转换为数据框并合并 pid 列。
  3. 有我自己的因变量,我将其用作 y_train 和 y_test 以及 X_train 和 X_test。
  4. 使用 dump_svmlight_file 将文件转换为 .train 和 .test 格式
  5. 创建了一个组和查询文件,其中包含调用 pid 的次数
  6. 传递此信息以训练模型。
  7. 模型运行良好,但返回的值与我的因变量不同。

我怀疑我是否遵循了正确的步骤。如果是,那么如何解释模型预测值以识别列表排名。此外,我仅使用单个指标 ndcg。我想获得有关损失和准确性以及如何改进模型的信息。

请给我提供合适的链接和流程。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。