微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

拟合分类树并使用测试集

如何解决拟合分类树并使用测试集

library(tree)
library(ISLR)
data("Carseats")
High<-ifelse(Carseats$Sales<=8,'No','Yes')
Carseats<-data.frame(Carseats,High)
tree.Carseats<-tree(as.factor(High)~.-Sales,data = Carseats)
summary(tree.Carseats)
plot(tree.Carseats)
text(tree.Carseats,pretty=0)
set.seed(1)
train=sample(1:nrow(Carseats),200)

我写信是想询问代码 train=sample(1:nrow(Carseats),200)

代码的结果只是显示数据,我无法使用 View(train) 查看数据集。

IMO,我认为对于 sample,我们将选择数据集 data(Carseats) 的行,每个元素应包含一些标签,例如 Sales、Income...

也许我对背后的理论想法感到困惑。

解决方法

train=... 行代码只是创建了一个包含 200 个随机数(介于 1 和 nrow(Carseats) 之间)的整数向量。您需要实际对数据进行子集化。像这样:

train_index <- sample(nrow(Carseats),200)
training_data <- Carseats[train_index,]

然后你会希望你的测试数据有剩余的观察,例如,

test_data <- Carseats[-train_index,]

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。