微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用另一列作为支持向后和向前填充“缺失值”NA

如何解决使用另一列作为支持向后和向前填充“缺失值”NA

假设我有以下数据:

input = tibble::tibble(
  group = c(rep("A",5),rep("B",rep("C",5)),value = c(10,15,17,NA,12,16,13,19),gr = c(0.1,0.05,0.03,0.02,0.04,0.6,0.4,0.01,0.09,-0.03,0.04)
)

看起来像这样:

> input
# A tibble: 15 x 3
   group value    gr
   <chr> <dbl> <dbl>
 1 A        10  0.1 
 2 A        15  0.05
 3 A        17  0.03
 4 A        NA  0.02
 5 A        NA  0.05
 6 B        NA  0.04
 7 B        NA  0.02
 8 B        12  0.6 
 9 B        16  0.03
10 B        13  0.4 
11 C        12  0.01
12 C        NA  0.09
13 C        15  0.05
14 C        NA -0.03
15 C        19  0.04

我想使用辅助变量(在本例中为 gr)填充每个组的缺失值。对于每个group,填充的方式是不同的。例如,对于group A,它应该向前完成,即value_filled = lag(value) * (1 + gr)。同时,对于group B 应该向后进行,即value_filled = lag(value) / (1 + gr)。对于 group C(在这种情况下,缺失值介于两者之间),需要向前填充。

所需的输出是这样的:

desired_output = tibble::tibble(
  group = c(rep("A",0.04),value_filled = c(10,17.3,18.2,7.3,7.5.7,14.5,19)
)
> desired_output
# A tibble: 15 x 4
   group value    gr value_filled
   <chr> <dbl> <dbl>        <dbl>
 1 A        10  0.1          10  
 2 A        15  0.05         15  
 3 A        17  0.03         17  
 4 A        NA  0.02         17.3
 5 A        NA  0.05         18.2
 6 B        NA  0.04         7.3
 7 B        NA  0.02         7.5
 8 B        12  0.6          12  
 9 B        16  0.03         16  
10 B        13  0.4          13  
11 C        12  0.01         12  
12 C        NA  0.09         13  
13 C        15  0.05         15  
14 C        NA -0.03         14.5
15 C        19  0.04         19 

我希望这可以在 dplyr 中完成。

解决方法

你可以这样做;

library(tidyverse)
input %>%
  group_by(group) %>%
  mutate(v1 = unlist(accumulate2(value,tail(gr,-1),~if(is.na(..2)) ..1*(1+..3) else ..2)),v1 = rev(unlist(accumulate2(rev(v1),head(rev(gr),~if(is.na(..2)) ..1/(1+..3) else ..2))))
# A tibble: 15 x 4
# Groups:   group [3]
   group value    gr    v1
   <chr> <dbl> <dbl> <dbl>
 1 A        10  0.1  10   
 2 A        15  0.05 15   
 3 A        17  0.03 17   
 4 A        NA  0.02 17.3 
 5 A        NA  0.05 18.2 
 6 B        NA  0.04  7.35
 7 B        NA  0.02  7.5 
 8 B        12  0.6  12   
 9 B        16  0.03 16   
10 B        13  0.4  13   
11 C        12  0.01 12   
12 C        NA  0.09 13.1 
13 C        15  0.05 15   
14 C        NA -0.03 14.6 
15 C        19  0.04 19 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。