我有一个分配给名为’temps’的变量的数据集,它有’date’,’temperature’,’country’列.
我想做这样的事情,我可以在sql中做
我想做这样的事情,我可以在sql中做
SELECT * FROM temps WHERE country != 'mycountry'
如何在R中进行类似的选择?
解决方法
我们可以在基R中使用类似的语法
temps[temps$country != "mycountry",]
基准
set.seed(24) temps1 <- data.frame(country = sample(LETTERS,1e7,replace=TRUE),val = rnorm(1e7)) system.time(temps1[!temps1$country %in% "A",]) # user system elapsed # 0.92 0.11 1.04 system.time(temps1[temps1$country != "A",]) # user system elapsed # 0.70 0.17 0.88
如果我们使用包解决方案
library(sqldf) system.time(sqldf("SELECT * FROM temps1 WHERE country != 'A'")) # user system elapsed # 12.78 0.37 13.15 library(data.table) system.time(setDT(temps1,key = 'country')[!("A")]) # user system elapsed # 0.62 0.19 0.37
原文地址:https://www.jb51.cc/mssql/77596.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。