如何解决使用dplyr R识别与参考时间有任何重叠的条目
我有一组来自不同站点的音频剪辑,它们是我手动提取的,而一组文件是自动提取的。我想在同一站点和文件中识别自动提取集中与手动提取集中完全重叠的任何剪辑。
例如:
library(dplyr)
set.seed(123)
group <- as.factor(round(runif(100,1,10),0))
file <- sample(LETTERS,100,TRUE)
start <- round(runif(100,100),2)
end <- round(start + (runif(100,1)),2)
auto <- bind_cols(group,file,start,end) %>%
set_names(.,nm = c("group","file","start","end"))
man <- bind_rows(sample_n(auto,10) %>%
mutate(start = round(start - runif(10,1),2),end = round(end - runif(10,0.5),2)),sample_n(auto,10) %>%
mutate(start = round(start + runif(10,end = round(start + runif(10,2)))
我一直试图像这样使用dplyr::between
:
res <- auto %>%
left_join(.,man,by = c("group","file")) %>%
drop_na() %>%
mutate(pos = (between(start.x,start.y,end.y) | between(end.x,end.y)))
但是它只是返回FALSE
。该代码不会引发错误,所以我猜我编写它的方式存在问题。
如果您在最后一个mutate
中拆分或,以检查是否有between
函数是这样的,
res <- auto %>%
left_join(.,"file")) %>%
drop_na() %>%
mutate(x = between(start.x,end.y),y = between(end.x,pos = x | y == "TRUE")
您会看到它们都返回FALSE
。
这似乎应该是一个相对简单的事情,但是我正在努力弄清楚。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。