如何解决实现列表学习排序算法时面临的问题
我正在尝试使用学习排名算法来训练我的模型以解决项目排名问题。目前为此目的使用 scikit-learn LightGBM。 完成了一些初始步骤,但我不确定该过程是否正确。
- 我的项目 ID 在我的场景中被转换为 pid。
- 我的数据是 csv 格式,因此将其转换为数据框并合并 pid 列。
- 有我自己的因变量,我将其用作 y_train 和 y_test 以及 X_train 和 X_test。
- 使用 dump_svmlight_file 将文件转换为 .train 和 .test 格式
- 创建了一个组和查询文件,其中包含调用 pid 的次数。
- 传递此信息以训练模型。
- 模型运行良好,但返回的值与我的因变量不同。
我怀疑我是否遵循了正确的步骤。如果是,那么如何解释模型预测值以识别列表排名。此外,我仅使用单个指标 ndcg。我想获得有关损失和准确性以及如何改进模型的信息。
请给我提供合适的链接和流程。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。