微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

另一个聚合

(对不起,如果标题不是很有用:我不知道如何更好地定义这个问题)

我的数据格式如下:

 

在每个组中,我有一个前置值和一个或两个后置值.我想将此表转换为以下内容

我想用以下的方式对数据进行分组:

aggregate(mydata,by = group,FUN = myfunction)

要么

ddply(mydata,.(group),.fun = myfunction)

并在我的函数中处理每个组的元素.但我不知道如何做到这一点,因为我需要同时将类型和值传递给我的函数.有一个更好的方法吗?

更新:快速和脏的样本数据集:

mydata <- data.frame(group = sample(letters[1:5],10,replace = TRUE),type = sample(c("pre","post"),value = rnorm(10))

解决方法

尝试这样的事情:

mydf <- data.frame(group = c("A","A","B","C","D","E","E"),type = c("pre","post","pre",value = 1:11)

times <- with(mydf,ave(value,group,type,FUN = seq_along))
xtabs(value ~ group + interaction(type,times),mydf)
#      interaction(type,times)
# group post.1 pre.1 post.2 pre.2
#     A      2     1      0     0
#     B      4     3      0     0
#     C      6     5      7     0
#     D      9     8      0     0
#     E     11    10      0     0

要么:

times <- with(mydf,FUN = seq_along))  
mydf$timevar <- interaction(mydf$type,times)
reshape(mydf,direction = "wide",idvar = "group",timevar="timevar",drop="type")
#    group value.pre.1 value.post.1 value.post.2
# 1      A           1            2           NA
# 3      B           3            4           NA
# 5      C           5            6            7
# 8      D           8            9           NA
# 10     E          10           11           NA

在两种解决方案中,关键是创建一个“时间”变量,该变量由“类型”和可以用ave创建的序列变量的组合表示.

为了完整,这里是来自“reshape2”的dcast:

times <- with(mydf,FUN = seq_along))
library(reshape2)
dcast(mydf,group ~ type + times)
#   group post_1 post_2 pre_1
# 1     A      2     NA     1
# 2     B      4     NA     3
# 3     C      6      7     5
# 4     D      9     NA     8
# 5     E     11     NA    10

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐