如何解决如何计算数据帧中每个变量值组合出现的时间?
我可以使用 distinct() 获取所有唯一组合的数据框,现在我想获取每个唯一组合出现的次数。我使用的实际数据帧有超过 10k 个组合,因此我无法手动计算。
n=1000000
X = rbinom(size=1,n,p=0.3)
U = rbinom(size=1,p=0.5)
Y = rbinom(size=1,p=0.1)
dat<-data.frame(X,Y,U)
distinct(dat,X,U)
解决方法
您可以使用 dplyr::count
,也可以像这样查看 dplyr::add_count
:
dplyr::count(dat,X,U)
# identical to
dplyr::group_by(dat,U) %>%
summarise(n = n())
dplyr::add_count(dat,U)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。