如何解决如何修复 ValueError:X 每个样本有 86 个特征;期待 52640
我正在从事情感分析项目,在该项目中我使用逻辑回归来训练模型。当我预测测试数据时模型工作正常,但当我使用新数据时它不起作用。 ValueError:X 每个样本有 86 个特征;期待 52640
import pandas as pd
mr = pd.read_csv("IMDB Dataset.csv")
mr.isnull().values.any()
mr.shape
data = []
data_lable = []
reviews = mr.review.fillna(' ')
for review in reviews:
data.append(review)
lables = mr.sentiment.fillna(' ')
for lable in lables:
data_lable.append(lable)
from sklearn.feature_extraction.text import CountVectorizer
vector = CountVectorizer()
features = vector.fit_transform(data)
features = vector.fit_transform(data1)
feature_nd = features.toarray()
def feature_extration(data):
features = vector.fit_transform(data)
feature_nd = features.toarray()
return feature_nd
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(
feature_nd,data_lable2,train_size=0.80,random_state=1234)
from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
lr=lr.fit(X_train,y_train)
这条线运行良好
y_pred = lr.predict(X_test)
y_predtion = lr.predict(feature_extration([new_data]))
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。