如何解决为什么 numpy 在尝试预测回归时会引发异常错误:“ufunc 'add' 不包含具有签名匹配类型的循环”?
我目前正在尝试使用测试和训练数据创建多元线性回归以估算房价(通过使用两个名为“Quadratmeter”和“Gewinn”的回归量)。
我想在模型中插入一些测试数据,并将预测的 y 值与实际值进行比较。因此,我使用了一个 for 循环来并排显示它们。
这是使用的全部代码:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
df = pd.read_csv("...")
head = df.head()
pd.set_option('display.expand_frame_repr',False)
print(head)
X = df[["Gewinn","Quadratmeter"]]
y = df[["Preis in Mio"]]
X_train,X_test,y_train,y_test = train_test_split(X,y,random_state=0,test_size=0.25)
model = LinearRegression()
model.fit(X_train,y_train)
print(model.intercept_)
print(model.coef_)
# complete model: Preis = 6.48370247 + Gewinn * 6.39855984e-06 + Quadratmeter * 3.89642288e-03 + e
y_test_pred = model.predict(X_test)
for i in range(0,len(y_test_pred)):
print(y_test_pred[i][0] + "-" + y_test[i][0])
不幸的是,在尝试运行程序时出现以下错误代码(这是由于 for 循环):
numpy.core._exceptions.UFuncTypeError: ufunc 'add' did not contain a loop with signature `enter code here`matching types (dtype('<U32'),dtype('<U32')) -> dtype('<U32')
感谢任何帮助。
解决方法
如果您想比较 y_test_pred
和 y_test
,我建议创建一个包含这两个值的数据框。这使比较更容易,而且您可以保存值并进行计算。
results_df = pd.DataFrame({'predictions': y_test_pred,'actual_values':y_test})
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。