如何解决使用 vroom 在日期列和所有其他列中读取 R 中的双倍
我有包含超过 10000 个变量的 csv 文件。我想使用 vroom 来读取它们,并希望将第 1 列标识为日期,将第 2 列标识为字符,将第 3 和第 4 列标识为整数,并将所有其余列标识为双精度。我该怎么做?
我的代码看起来像这样,但失败了。
data81 <- vroom(fname_1981_2010,col_types = c(Date = col_date(),MonthDay = col_character(),doy = col_integer(),(.) = col_double()))
告诉 vroom 将其余列读取为 double 的语法是什么(替换我代码中的 (.)?谢谢。
解决方法
可以通过 .default
的 cols()
参数实现:
library(vroom)
set.seed(42)
d <- data.frame(
date = sample(seq(as.Date('1999/01/01'),as.Date('2000/01/01'),by="day"),12),MonthDay = sample(LETTERS[1:7],12,replace = TRUE),doy = 1:12,col4 = runif(12),col5 = runif(12),col6 = runif(12)
)
fname_1981_2010 <- "fname_1981_2010.csv"
write.csv(d,fname_1981_2010,row.names = FALSE)
vroom(fname_1981_2010,col_types = cols(date = col_date(),MonthDay = col_character(),doy = col_integer(),.default = col_double()))
#> # A tibble: 12 x 6
#> date MonthDay doy col4 col5 col6
#> <date> <chr> <int> <dbl> <dbl> <dbl>
#> 1 1999-02-18 D 1 0.514 0.208 0.619
#> 2 1999-11-17 A 2 0.390 0.907 0.333
#> 3 1999-06-02 E 3 0.906 0.612 0.347
#> 4 1999-03-15 F 4 0.447 0.380 0.398
#> 5 1999-08-16 D 5 0.836 0.436 0.785
#> 6 1999-05-26 B 6 0.738 0.0374 0.0389
#> 7 1999-05-02 B 7 0.811 0.974 0.749
#> 8 2000-01-01 G 8 0.388 0.432 0.677
#> 9 1999-05-08 C 9 0.685 0.958 0.171
#> 10 1999-10-30 A 10 0.00395 0.888 0.261
#> 11 1999-01-24 A 11 0.833 0.640 0.514
#> 12 1999-11-23 C 12 0.00733 0.971 0.676
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。