如何解决如何在 r 中查看交叉验证的重采样数据?
我是 tidymodels
的新手,也是 R 的新手。
我使用tidymodels
创建了一个配方,它在训练数据上运行良好,但在交叉上出现错误经过验证的重采样。
所以我想查看重采样,但它们不是简单的 df 格式。
train_5fold
############ result ###########
splits id
<list> <chr>
<S3: vfold_split> Fold1
<S3: vfold_split> Fold2
<S3: vfold_split> Fold3
<S3: vfold_split> Fold4
<S3: vfold_split> Fold5
下载数据
https://github.com/johnsnow09/covid19-df_stack-code/blob/main/train_5fold.RDS
train_5fold <- readRDS("train_5fold.RDS")
我如何查看它们??
我尝试了 pluck()、unnest_wider、unlist 等,但无法获得真正的数据框。
我还在 tidymodels 上发布了另一篇 SO 帖子,该帖子至今仍未得到答复,因此尝试通过交叉检查 CV 数据进行调试
Getting error when trying to apply tidymodels recipe from train data to resamples in r?
解决方法
您可以使用 splits
作为 -
lapply
获取数据
df <- readRDS('train_5fold.RDS')
list_df <- lapply(df$splits,`[[`,'data')
如果您想将它们组合在一个数据框中,请使用 res <- do.call(rbind,list_df)
或与 purrr
-
library(purrr)
res <- map_df(df$splits,pluck,'data')
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。