如何解决根据每个组的特定行计算 R 中行之间的差异
大家好, 我有一个数据框,其中每个 ID 都有 1-5 次多次访问。我正在尝试计算每次访问与访问 1 之间的分数差异。例如。 (Score(Visit 5-score(Visit1) 等等。我如何在 R 中实现?下面是一个示例数据集和结果数据集
structure(list(ID = c("A","A","B","B"),Visit = c(1L,2L,3L,4L,5L,1L,3L),Score = c(16,15,13,12,20,19,18)),class = "data.frame",row.names = c(NA,-8L))
#> ID Visit Score
#> 1 A 1 16
#> 2 A 2 15
#> 3 A 3 13
#> 4 A 4 12
#> 5 A 5 12
#> 6 B 1 20
#> 7 B 2 19
#> 8 B 3 18
由 reprex package (v2.0.0) 于 2021 年 5 月 20 日创建
这是预期的输出
解决方法
这是使用 dplyr
library(dplyr)
df %>%
group_by(ID) %>%
mutate(Difference = ifelse(Visit == 1,NA,Score[Visit == 1] - Score))
# A tibble: 8 x 4
# Groups: ID [2]
ID Visit Score Difference
<chr> <int> <dbl> <dbl>
1 A 1 16 NA
2 A 2 15 1
3 A 3 13 3
4 A 4 12 4
5 A 5 12 4
6 B 1 20 NA
7 B 2 19 1
8 B 3 18 2
样本数据
df <- data.frame(
ID = c('A','A','B','B'),Visit = c(1:5,1:3),Score = c(16,15,13,12,20,19,18)
)
旁注:下次我建议您不要发布图像,而是使用数据框上的 dput()
函数发布示例数据
使用 dplyr
的 first
解决方案
data <- data.frame(
ID = c(rep("A",5),rep("B",3)),18))
library(dplyr)
data %>%
group_by(ID) %>%
arrange(Visit) %>%
mutate(Difference = first(Score) - Score)
#> # A tibble: 8 x 4
#> # Groups: ID [2]
#> ID Visit Score Difference
#> <chr> <int> <dbl> <dbl>
#> 1 A 1 16 0
#> 2 A 2 15 1
#> 3 A 3 13 3
#> 4 A 4 12 4
#> 5 A 5 12 4
#> 6 B 1 20 0
#> 7 B 2 19 1
#> 8 B 3 18 2
由 reprex package (v2.0.0) 于 2021 年 5 月 20 日创建
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。