微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

按数据框分组并在 r

如何解决按数据框分组并在 r

我有一个喜欢的 df

ProjectID dist
  1        x
  1        y
  2        z
  2        x
  2        h
  3        k
  ....     ....

一个长度为unique(df$ProjectID)的索引向量,如

  2        
  3        
  1        
  ....    

我想通过ProjectID获取dist,其索引是项目ID对应的元素向量。所以我想要的结果看起来像

ProjectID dist
  1        y
  2        h
  3        k
  ....     ....

我试过了

aggregate(XRKL ~ ID,FUN=..?,data=df)

但我不确定我可以把索引向量放在哪里。有没有办法从 dply ftns、tapply 或聚合中获得正确的结果?还是我需要自己做一个功能?谢谢。

解决方法

您可以在数据帧本身中添加索引,然后从每个组中选择该行。

inds <- c(2,3,1)

df %>%
  mutate(inds = inds[match(ProjectID,unique(ProjectID))]) %>%
  #If ProjectID is sequential like 1,2,3
  #mutate(inds = inds[ProjectID]) %>%
  group_by(ProjectID) %>%
  slice(first(inds)) %>%
  ungroup() %>%
  select(-inds)

#  ProjectID Dist 
#      <int> <chr>
#1         1 y    
#2         2 h    
#3         3 k    

数据

df <- structure(list(ProjectID = c(1L,1L,2L,3L),Dist = c("x","y","z","x","h","k")),class = "data.frame",row.names = c(NA,-6L))

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。