如何解决R-由于精度下降,无法从<grouped_df <转换为<tbl_df <
我有一个从正常数据帧生成的数据帧矢量列表,如下所示。基因表达包含识别每个观察者的细胞系,基因,染色体区域和表达水平的列-多个基因可能属于特定的染色体区域,我想将一个染色体区域中的表达与其他所有染色体进行比较。看起来像这样:
gene region cell_line expression
A X Joe 1
B X Joe 2
C Y Joe 2
D Z Joe 3
E Z Joe 0
A X Claire 2
B X Claire 1
C Y Claire 3
D Z Claire 3
E Z Claire 1
我根据细胞系将其拆分。
gene_expression_groups <- gene_expression %>%
group_by(cell_line) %>%
group_split()
接下来,我尝试通过以下方式获得除所有区域中所述区域以外的所有染色体区域的均值表达
for (i in seq_along(gene_expression_groups)){
gene_expression_groups[[i]] <- as_tibble(gene_expression_groups[[i]]) %>%
group_by(chromosomal_region) %>%
group_modify(~anti_join(gene_expression_groups[[i]],.) %>%
summarize(muG = mean(expression),sigma2G = var(expression),NG = n()))
}
理想情况下,最终产品将是一个新的向量列表,每个拆分组现在看起来都像这样。
region cell_line mean_other standard_deviation_other
X Joe 1.67 some number
Y Joe 1.5 some number
Z Joe 1.67 some number
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。