如何解决在继续使用R Studio以表格格式查看数据之前,如何为我的变量之一过滤数据
R社区!我在这里需要帮助。
我的问题: 我需要使用HER2_IHC和HER2_ISH(我的变量)创建一个数据表。但是,在创建此表之前,我需要基于第三个变量过滤数据。也就是说,我只需要在HER2_pos(第3个变量)下使用“负”数据值。
这里的所有变量都是分类的。
如果您能帮助我找出解决此问题的正确R代码,将不胜感激!
解决方法
有些猜测,这就是我的想法。 首先,我们需要根据您的建议使用明显随机的数据创建小标题(数据框):
library(dplyr)
library(tibble)
data <- tibble(
VAR1 = sample(c("positive","negative","equivocal"),size = 100,replace = TRUE),VAR2 = sample(c("positive",replace = TRUE)) %>%
filter(VAR1 != "equivocal" | VAR2 != "equivocal")
data <- data %>%
rowwise() %>%
mutate(VAR3 = ifelse(VAR1 == "equivocal" | VAR2 == "equivocal",sample(c("positive","negative"),size = 1,replace = FALSE),NA))
哪个给我这个带有所需功能的虚假提示:
> data
# A tibble: 88 x 3
# Rowwise:
VAR1 VAR2 VAR3
<chr> <chr> <chr>
1 equivocal negative positive
2 equivocal negative positive
3 positive equivocal negative
4 negative equivocal positive
5 equivocal negative positive
6 positive negative NA
7 positive equivocal negative
8 positive positive NA
9 positive positive NA
10 positive positive NA
# ... with 78 more rows
假设这就是您想要的,下一步非常简单:
data <- data %>%
filter(VAR3 == "negative")
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。