如何解决CSV到具有多个CSV的磁盘框架
some.df = csv_to_disk.frame(list.files("some/path"))
split_every_nlines(name_in = normalizePath(file,mustWork = TRUE),:期望单个字符串值:[type = character; 程度上= 3]。
我得到了一个带有for循环的临时解决方案,该循环遍历每个文件,然后将所有磁盘框架重新绑定在一起。
解决方法
这似乎是由bigreadr
软件包触发的错误。我想知道您是否有办法重现这些块。
或者尝试使用其他的块读取器,
csv_to_disk.frame(...,chunk_reader ="data.table")
此外,如果所有操作都失败了(因为很难读取CSV),则以循环方式读取它们,然后追加也可以。
也许您需要指定仅读取CSV?喜欢
list.files("some/path",pattern=".csv",full.names=TRUE)
否则,它通常可以正常工作
library(disk.frame)
tmp = tempdir()
sapply(1:10,function(x) {
data.table::fwrite(nycflights13::flights,file.path(tmp,sprintf("tmp%s.csv",x)))
})
library(disk.frame)
setup_disk.frame()
some.df = csv_to_disk.frame(list.files(tmp,pattern = "*.csv",full.names = TRUE))
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。