微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

TRUE 值的输出

如何解决TRUE 值的输出

我有一个包含 Site_name 和 Race 列的数据框 'df'。 Site_name 有 4 个类别,Race 有 6 个类别,其中一个被称为“Missing”。

我只想显示每个 Site_name 的“缺失”计数。我正在使用以下代码

dplyr::count(df,Site_name,Race %in% "Missing")

我得到的输出是:

站点名称 比赛%in%“失踪” n
真的 64
错误 231
b 真的 75
b 错误 213
c 真的 23
c 错误 73
d 真的 8
d 错误 12

但我只想输出如下所示的 TRUE 值:

站点名称 比赛%in%“失踪” n
真的 64
b 真的 75
c 真的 23
d 真的 8

解决方法

使用 group_by + summarise 并使用 sum 计算每个 "Missing" 具有 Site_name 值的值的数量。

library(dplyr)
df %>% group_by(Site_name) %>% summarise(n = sum(Race %in% "Missing"))
,

我们可以使用base R

aggregate(cbind(n = Race %in% "Missing") ~ Site_name,df,FUN = sum)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。