如何解决有没有办法在 R 中的两个数据帧上应用具有多个参数的函数?
我想编写一个函数,将“values”data.frame 中“+”的值替换为“others”data.frame 中的相应值。
values <- data.frame(A = c("banana","orange","apple","pear","+"),B = c("apple","+","banana","melon","orange"))
others <- data.frame(A = c("","","apple"),B = c("",""))
names <- c("A","B")
#function to replace values of "+" with corresponding value in other data.frame
replace_with_other <- function(x,y) {
ifelse(x == "+",y,x)
}
这个函数是这样工作的,但我不知道如何遍历“names”中的所有值。
#this works and gives the desired output
replace_with_other(values$A,others$A)
#but when I try to iterate over all the names,I get an error message.
map(names,replace_with_other(values,others))
对于名字“A”,我正在寻找的输出是
"banana" "orange" "apple" "pear" "apple"
有人有什么想法吗?
解决方法
这对你有用吗?
> Map(replace_with_other,values[names],others[names])
$A
[1] "banana" "orange" "apple" "pear" "apple"
$B
[1] "apple" "pear" "banana" "melon" "orange"```
,
我们可以在 dplyr
本身内做到这一点。由于列名相同,我们可以循环 across
'values' 中的所有列,使用 cur_column()
从 'others' 中提取相应的列(返回 across
中的列名),将 ""
替换为 NA
(na_if
) 并使用 coalesce
以便它将替换为第一个非 NA 元素
library(dplyr)
values %>%
mutate(across(everything(),~
coalesce(na_if(others[[cur_column()]],""),.)))
# A B
#1 banana apple
#2 orange pear
#3 apple banana
#4 pear melon
#5 apple orange
或者可以使用 map2
library(purrr)
map2(values[names],others[names],replace_with_other)
,
你也可以这样做:
replace_with_other <- function(x,y,name) {
ifelse(x[[name]] == "+",y[[name]],x[[name]])
}
purrr::map(names,~replace_with_other(values,others,.x))
# [[1]]
# [1] "banana" "orange" "apple" "pear" "apple"
#
# [[2]]
# [1] "apple" "pear" "banana" "melon" "orange"
,
我想提出一些不同的建议,也许它对您的所有数据都有帮助:
# function that replace + with corrispondent values in another df
func <- function(x,y){
# convert as matrix the two imputs
a <- as.matrix(x)
b <- as.matrix(y)
# paste0 them i.e. merge in one matrix
ab <- matrix(paste0(a,b),nrow = nrow(a))
# replace the + with nothing and convert as df
ab <- data.frame(gsub("\\+","",ab))
# colnames from the first input
colnames(ab) <- colnames(x)
# print the output
print(ab)}
func(values,others)
A B
1 banana apple
2 orange pear
3 apple banana
4 pear melon
5 apple orange
,
找到 '+'
中出现 values
的位置,并用 others
中的相应值替换它。
mat <- values == '+'
values[mat] <- others[mat]
values
# A B
#1 banana apple
#2 orange pear
#3 apple banana
#4 pear melon
#5 apple orange
这要求两个数据框的列名与示例数据中共享的列名顺序相同。如果不是,您可以重新排列列。
values <- values[names]
others <- others[names]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。