如何解决Python,回归,决策树
我提前为我的英语道歉,但这不是我的母语。因此,我似乎很难解决困扰我的问题。
我会直接澄清。我创建了一个学期的“项目”,用于通过回归学习的研究。多亏了scrapy库和来自metacritic.com的信息,我自己构建了数据库
这是数据库标题的样子。
(https://i.ibb.co/p2pk2bd/stack1.png)
经过可视化操作(图形、直方图等)和改变值类型的操作后,数据库如下所示:
(https://i.ibb.co/J2Gn0Ms/stack2.png)
使用以下方法创建向量:
A = LabelBinarizer (). Fit_transform (games.Publisher)
for i in range (len (games.Publisher)):
games.at [i,'Publisher'] = A [i]
列值类型如下:
(https://i.ibb.co/q9vMVK1/stack3.png)
我将集合分成 X 和 y。
X = games.drop(['Name','Metascore','Desc','Release Date','Userscore'],axis=1)
y = games['Metascore']
X:
(https://i.ibb.co/VJ0LZfG/stack4.png)
是:
(https://i.ibb.co/Qvsw9JT/stack5.png)
使用函数:
X_train,X_test,y_train,y_test = train_test_split (X,y,test_size = 0.3,random_state = 1)
我将集合分成子集。
问题出现在回归的时候(这里需要用到决策树方法)
(https://i.ibb.co/bL8Xyhz/stack6.png)
要是有这么好心的人帮我克服这个错误就好了
解决方法
要么很简单,要么我误解了你:
在“开发人员”和其他列下,您有数组。为什么? 这就是异常的原因。这个错误信息也顺便说明一下。
用 0 或占位符或实际值替换每个数组,它应该可以工作。 如果数组中的值很重要,您应该为每个数组制作一行。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。