如何解决R - 根据条件连接行?
我在 R 中创建了一个映射表并提供了一个示例:
ex <- data.frame("id" = c(rep(1234,7)),"claim" = c(1234,1367,1234,1869,1234),"code1" = c(24,61,28,21,20,29,80),date = c('2019-03-18','2019-04-12','2019-03-18','2019-03-18'),'code2' = c(24,24,24),dx1=c("M234","M123",NA,"M434",NA),dx2=c(NA,"M789","Z123","M999"),dx3 = c(NA,"M689",pay = c(1000,520,1000,780,1000))
有什么办法可以找到将其作为最终输出的方法:
ex2 <- data.frame("id" = c(rep(1234,3)),'2019-04-12'),29),"M123"),dx2=c("M789","Z123"),dx3 = c("M689",dx4 = c("M999",520))
我基本上希望将示例 1 中 dx2 或 dx3 中的任何值添加到与该 code2 值对应的同一行中。但是,如果 dx1 中的 code2 有多个值,那么我想将它们作为单独的行保留。
有什么办法可以在 R 中做这样的事情吗? 提前致谢!
编辑:在我的映射表(例如)中只有 dx1、dx2、dx3 列。我希望将 dx2 或 dx3 中的任何多个值添加为新列(这就是为什么在 ex2 中现在有一个 dx4 列)。这些更改按 code2 分组。因此,如果代码 24 的 dx2 或 dx3 中有多个值,那么这将决定创建多少个新的 dx2 列。然后可以通过 max(pay) 列确定订单。
解决方法
你需要这个吗?
library(tidyverse)
ex %>% pivot_longer(cols = c("dx1","dx2","dx3"),names_to = "code3",values_to = "val",values_drop_na = T) %>%
arrange(claim,code2,code3) %>% group_by(id,claim,date,code3) %>%
mutate(dummy = n(),dummy2 = row_number(),code3 = ifelse(dummy >1 & dummy2 >1,"dx4",code3)) %>% arrange(code3) %>%
pivot_wider(id_cols = c('id','claim','date','code2','pay'),names_from = 'code3',values_from = 'val',values_fn = min) %>%
ungroup() %>% select(-claim)
# A tibble: 3 x 8
id date code2 pay dx1 dx2 dx3 dx4
<dbl> <chr> <dbl> <dbl> <chr> <chr> <chr> <chr>
1 1234 2019-03-18 24 1000 M234 M789 M689 M999
2 1234 2019-04-12 29 520 M123 Z123 NA NA
3 1234 2019-03-18 24 780 M434 NA NA NA
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。