如何解决如何在使用 XGBoost 的学习排名中保留 id 以供以后预测
我正在使用 xgboost 进行排名,请考虑以下代码:
X_train = train_data.loc[:,~train_data.columns.isin(['id','rank'])]
y_train = train_data.loc[:,train_data.columns.isin(['rank'])]
groups = train_data.groupby('id').size().to_frame('size')['size'].to_numpy()
X_test = test_data.loc[:,~test_data.columns.isin(['rank'])]
y_test = test_data.loc[:,test_data.columns.isin(['rank'])]
因为需要保留 id 以供以后预测。下面的代码对吗?
def predict(model,df):
return model.predict(df.loc[:,~df.columns.isin(['id'])])
predictions = (X_test.groupby('id')
.apply(lambda X_test: predict(model,X_test)))
值越高越好吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。