微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用 R 中的管道运算符找到数据框一列的平均值?

如何解决如何使用 R 中的管道运算符找到数据框一列的平均值?

我正在为我的一门课做作业。我们必须使用管道操作符来获得体积大于 13 的树木的平均高度。

所以最初,我尝试了:

df <- trees

df %>% filter(Volume > 13) %>% mean(Height)

问题是,然后我收到一条警告消息

Warning message:
In mean.default(.,Height) :
  argument is not numeric or logical: returning NA

我无法弄清楚 Height 为何不是数字(对我来说它很明显看起来像一个数字列表),所以我无法完成这个问题。

有人可以帮我吗?我一直在测试不同的变体,但无济于事。

解决方法

我们可以在mean内得到summarise

library(dplyr)
df %>% 
   filter(Volume > 13) %>%
   summarise(Mean = mean(Height))

mean 需要 vector,如果我们需要在 summarise pull 之外执行此操作,则“高度”为 vector

df %>%
  filter(Volume > 13) %>%
  pull(Height) %>%
  mean

或使用 .$Height

df %>%
    filter(Volume > 13) %>%
    .$Height %>%
    mean

可以使用 iris 数据重现警告

data(iris)
iris %>%
  mean(.$Sepal.Length)
#[1] NA

警告信息: 在 mean.default(.,.$Sepal.Length) 中: 参数不是数字或逻辑:返回 NA

它与管道无关。如果输入是 data.frame,则返回 NA,因为期望是 vector

mean(iris['Sepal.Length'])
#[1] NA

警告信息: 在 mean.default(iris["Sepal.Length"]) 中: 参数不是数字或逻辑:返回 NA

iris %>%
  .$Sepal.Length %>%
  mean
#[1] 5.843333

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。