如何解决查找数据集列中特定值的百分比
我有一个名为大学的数据集,其中一列被“接受”。此列有两个值 - 1(表示接受学生)和 0(表示不接受学生)。我要找到接受的学生百分比。
我这样做了...
table(college$accepted)
这给了我 1 和 0 的频率。(1 = 44,224 和 0 = 75,166)。然后我手动将这两个值相加 (119,390) 并除以 44,224/119,390。这很好,让我得到了我一直在寻找的价值。但我真的很想知道我如何用 R 代码做到这一点,因为我确定有一种方法可以做到这一点,我只是没有想到。
谢谢!
解决方法
也许你可以像下面这样使用prop.table
prop.table(table(college$accepted))["1"]
,
如果它是一个简单的 0/1 列,那么您只需要取该列的平均值。
mean_accepted <- mean(df$accepted)
,
您可以先对列求和,然后计算列中的总数
sum(college$accepted)/length(college$accepted)
,
为了使代码更明确并更好地描述您的意图,我建议使用条件来确定符合您的纳入标准的案例。例如:
college$accepted == 1
然后取逻辑向量的平均值来计算比例(在0和1之间),乘以100成为一个百分比。
100 * mean(college$accepted == 1,na.rm = TRUE)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。