微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何修复 ValueError:X 每个样本有 86 个特征;期待 52640

如何解决如何修复 ValueError:X 每个样本有 86 个特征;期待 52640

我正在从事情感分析项目,在该项目中我使用逻辑回归来训练模型。当我预测测试数据时模型工作正常,但当我使用新数据时它不起作用。 ValueError:X 每个样本有 86 个特征;期待 52640

import pandas as pd
mr = pd.read_csv("IMDB Dataset.csv")
mr.isnull().values.any()
mr.shape

data = []
data_lable = []

reviews = mr.review.fillna(' ')
for review in reviews:
    data.append(review)
    
lables = mr.sentiment.fillna(' ')
for lable in lables:
    data_lable.append(lable) 
from sklearn.feature_extraction.text import CountVectorizer
vector = CountVectorizer()
features = vector.fit_transform(data)

features = vector.fit_transform(data1)
feature_nd = features.toarray()

def feature_extration(data):
    features = vector.fit_transform(data)
    feature_nd = features.toarray()
    return feature_nd
from sklearn.model_selection import train_test_split

X_train,X_test,y_train,y_test  = train_test_split(
        feature_nd,data_lable2,train_size=0.80,random_state=1234)

from sklearn.linear_model import LogisticRegression

lr = LogisticRegression()
lr=lr.fit(X_train,y_train)

这条线运行良好

y_pred = lr.predict(X_test)

为此它显示错误

y_predtion = lr.predict(feature_extration([new_data]))

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。