微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

根据分组变量的可能组合创建完整的数据框架

如何解决根据分组变量的可能组合创建完整的数据框架

很抱歉,是否曾经有人问过这个问题,但是当存在三个分组变量时,我找不到所需的答案。

我需要用变量的可能组合来填充数据框,但是当不出现组合时,为不分组的观察值插入NA。假设有一个包含三个分组变量的数据框:年,地理和分组:

Year <- rep(2008:2019,each=50)
Geography <- rep(1:60,each=10)
Grouping <- rep(1:4,each=150)
value <- seq(rnorm(600,mean=0,sd=1))
df=cbind(Year,Geography)
df=as.data.frame(cbind(df,value))

但是数据框缺少一些随机观测,例如:

df2=df[-c(15,60,150,510),]

如何将数据帧改回长度为600(如果存在三个分组变量的所有可能组合,则为该长度),但是将NA插入其中,如果组合位于数据框?请注意,每个分组变量的所有唯一观测值都在某个时刻出现在数据集中。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。