如何解决将预测值与其索引/标识号相关联
我正在训练一个模型,根据某些数据预测对错。在训练和测试模型时,我从功能列表中删除了产品编号。
X = df.drop(columns = 'Product Number',axis = 1)
y = df['result']
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.2,random_state = 42)
SVC = LinearSVC(max_iter = 1200)
SVC.fit(X_train,y_train)
y_pred = SVC.predict(X_test)
我有什么办法可以恢复已通过或失败的商品的产品编号及其功能?如何将y_pred的结果与对应的产品编号相关联?
我还计划使用交叉验证,以便对数据进行重新整理,是否还有办法让我恢复每个测试项目的产品编号?
解决方法
我意识到我使用交叉验证只是为了评估我的模型的性能,所以我决定只运行我的代码而不改变数据以查看每个数据点的结果。
编辑:对于没有交叉验证的评估,我只在将不相关的列传递给分类器时删除它,如下所示:
cols = ['id','label']
X = train_data.copy()
y = train_data['label']
X_train,X_val,y_train,y_val = train_test_split(X,y,test_size=0.2,random_state=2)
knn = make_pipeline(StandardScaler(),KNeighborsClassifier(n_neighbors=10))
y_val_pred = knn.fit(X_train.drop(columns=cols),y_train).predict(X_val.drop(columns=cols))
X_val['y_val_pred'] = y_val_pred
我在预测后加入 y_val_pred
以检查哪些数据点被错误分类。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。