根据同一行位置中前一列的值来计算一列中的值

如何解决根据同一行位置中前一列的值来计算一列中的值

我有很多列要基于函数（1 + x）^ k计算值，其中x是来自特定列的值，k是我们尝试为其计算的列的索引。我只想对表中所有列的子集进行计算。

例如：

df = data.frame(A = c(0.1,0.05,0.2),B = c(1,1,1),C = c(NA,NA,NA),D = c(NA,NA)

我想使用A列中的值仅将函数应用于C和D列。

例如df [1,4]的计算方式为（1 +（-0.1）^ 4，因为4是D列的索引。

另一种解释是，对于选定的列（在此示例中为C和D），该值是前一列的值乘以（1 + x），即df [1,4] = df [1,3] *（1 +（-0.1）），结果相同

解决方法

一个dplyr选项可能是：

df %>%
 rowwise() %>%
 mutate((1 + A)^(across(C:D,~ replace(.,is.na(.),1)) * which(names(.) %in% c("C","D"))))

      A     B     C     D
  <dbl> <dbl> <dbl> <dbl>
1  0.1      1  1.33  1.46
2  0.05     1  1.16  1.22
3  0.2      1  1.73  2.07

或者C和D列始终为NA：

df %>%
 rowwise() %>%
 mutate((1 + A)^(1^across(C:D) * which(names(.) %in% c("C","D"))))

也许是这样的：

f = function(df,target_cols = c("C","D"),index_col = "A"){
  
  # df is your data frame 
  # target_cols is a vector of columns you want apply the function (1 + x)^k 
  # index_col is the the x in (1 + x)^k

  stopifnot(all(target_cols %in% names(df)))
  stopifnot(index_col %in% names(df))
  
  # Get index of target columns i.e k
  which_col = which(names(df) %in% target_cols)
  
  # Loop over columns
  for(i in which_col){
    df[,i] = (1 + df[,index_col])^i
  }
  
  return(df)
  
}

df = data.frame(A = c(0.1,0.05,0.2),B = c(1,1,1),C = c(NA,NA,NA),D = c(NA,NA))
f(df)                

     A B        C        D
1 0.10 1 1.331000 1.464100
2 0.05 1 1.157625 1.215506
3 0.20 1 1.728000 2.073600

您描述的功能定义如下：

func1 = function(df,i) {
  (1+df[1]^i)
}

base R中的一个选项应该是

df[3:4] <- (1 + df$A)^col(df)[,3:4]

或与Reduce

df[c('C','D')] <- lapply(match(c('C','D'),names(df)),function(i) 
     Reduce(function(x,y) (1 + y)^i,df[,'A'],accumulate = TRUE,init = df$A[1])[-1])

df
#     A B        C        D
#1 0.10 1 1.331000 1.464100
#2 0.05 1 1.157625 1.215506
#3 0.20 1 1.728000 2.073600

或使用map/accumulate

library(purrr)
library(dplyr)
map_dfc(set_names(match(c('C',names(df)[3:4]),~ {
            i <- .x
            accumulate(df$A,~(1 + .y)^i,.init = first(df$A))[-1]}) %>% 
   bind_cols(df[1:2],.)
#     A B        C        D
#1 0.10 1 1.331000 1.464100
#2 0.05 1 1.157625 1.215506
#3 0.20 1 1.728000 2.073600

根据同一行位置中前一列的值来计算一列中的值

如何解决根据同一行位置中前一列的值来计算一列中的值

解决方法

相关推荐