微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在R中的分类错误中将for循环转换为tapply

如何解决如何在R中的分类错误中将for循环转换为tapply

我编写了以下代码来使用 for 循环实现 $k$-fold 交叉验证的算法,如下所示(第一段代码), 对于第二段代码,我必须使用 tapply() 函数重写哈希标签行之间的代码,该函数应用匿名函数来计算每个折叠上的分类错误数(而不是错误率) .

输出一个向量,包含每个折叠的错误数,将进一步由 %>% sum 聚合并除以观察总数以产生错误率。

随意删除您认为不必要的内容

提示:您可能需要一个名为 logistic.pred 的局部变量来计算和存储中间结果。但是这个局部变量会比上面代码中的对应变量小得多,因为它只存储折叠的中间结果。 我试图通过简单地从 for 循环函数复制代码来处理第二部分。然而,我花了这么多小时,但仍然不知道该怎么做。我可以知道我该怎么做吗?

default.data <- read.csv("Default.csv",stringsAsFactors = T)
k <- 10
obs <- nrow(default.data)

set.seed(1)
partition <- (1:obs) %% k + 1 
fold <- sample(partition,length(partition))

logistic.fit <- vector("list",k)
logistic.prob <- vector("numeric",obs)  
logistic.pred <- rep("No",obs)

for (i in 1:k) {
  
  logistic.fit[[i]] <- glm(default ~ student + balance,family = binomial,data = default.data[fold!= i,])
  logistic.prob[fold == i] <- predict(logistic.fit[[i]],default.data[fold==i,],type="response")

}


logistic.pred[logistic.prob > 0.5] <- "Yes"
result <- mean(default.data["default"] != logistic.pred)

{r eval=F}
     tapply(1:obs,fold,function(idx){
         # Edit me
        logistic.fit <- vector("list",k)
        logistic.prob <- vector("numeric",obs)  
        logistic.pred <- rep("No",obs)

for (i in 1:obs) {
  
  logistic.fit[[i]] <- glm(default ~ student + balance,type="response")

}

logistic.pred[logistic.prob > 0.5] <- "Yes"
       }
       ) %>% sum %>% `/`(obs)
tapply(1:obs,function(1))

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。