如何解决复制行以匹配新的数据框
我正在使用R,但我有两个相关的小标记(数据帧),但现在它们是分开的。对于第一个小标题的每一行,它们是与该小标题相关的十(10)或更少的行。所以,我的第一个小表情是这样的...
A 0.1
B 0.2
C 0.3
D 0.4
E 0.5
第二个小标题看起来像这样...
A 1.5
A 1.6
A 1.7
A 1.8
A 1.9
B 2.5
B 2.6
B 2.7
B 2.8
B 2.9
C 3.1
C 3.3
D 4.4
D 4.6
E 6.6
E 6.7
因此,我需要复制第一个小节的值以匹配第二个小节。所以,我需要第一个小标题看起来像这样……
A 0.1
A 0.1
A 0.1
A 0.1
A 0.1
B 0.2
B 0.2
B 0.2
B 0.2
B 0.2
C 0.3
C 0.3
D 0.4
D 0.4
E 0.5
E 0.5
我遇到的问题是,第二个小标题上重复的值的次数不一致。因此,有时第一个小标题的值需要重复x5次,x2次等。
如果需要以不一致的方式复制第一个小标题的值,我该如何复制它们。一些5,一些2,一些3等,等等。
解决方法
仅选择tibble2的第一列,然后与tibble1左连接。
library(tidyverse)
tibble2 %>%
select(col1) %>%
left_join(tibble1,by = 'col1')
,
您可以在count
中使用df2
个值,与df1
联接并使用uncount
来重复行。
library(dplyr)
df2 %>%
count(V1) %>%
left_join(df1,by = 'V1') %>%
tidyr::uncount(n)
数据
df1 <- structure(list(V1 = c("A","B","C","D","E"),V2 = c(0.1,0.2,0.3,0.4,0.5)),class = "data.frame",row.names = c(NA,-5L))
df2 <- structure(list(V1 = c("A","A","E",V2 = c(1.5,1.6,1.7,1.8,1.9,2.5,2.6,2.7,2.8,2.9,3.1,3.3,4.4,4.6,6.6,6.7
)),-16L))
,
这里有一种dplyr
和一种base
的方式。不确定如何处理不匹配项。
library(dplyr)
df1 = tibble(ID = LETTERS[1:5],val = seq(0.1,0.5,by = 0.1))
s = sample(5)
df2 = tibble(ID = rep(LETTERS[1:5],s),val2 = rep(s,s) + 0.1 * sequence(s))
inner_join(df1,df2)%>%
select(-val2)
## base
tbl = table(df2$ID)
df1[rep(match(df1$ID,names(tbl)),tbl),]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。