微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何通过匹配 R 中的特定列将数百列合并到一个数据框中?

如何解决如何通过匹配 R 中的特定列将数百列合并到一个数据框中?

我目前有数百个包含唯一 ID 和非标准化读取计数的文件。我想从每个文件获取读取计数,并将它们全部与第一列中的唯一 ID 匹配。但是,每个文件都有不同数量的计数和不同的 ID,这些 ID 可能包含也可能不包含来自最后一个文件的重复项。 (基本上我想为 DESeq2 制作一个计数文件

我使用下面的代码来合并这些文件,但计数与原始 ID 不匹配。

我的总体目标是从每个文件获取未规范化的读取计数,并将它们与一个数据框与相应的唯一 ID 的总列表相匹配——如果该文件没有该特定 ID 的计数,则可以填充0.

'''

DF = do.call(cbindX,lapply( list.files(pattern=".*.txt"),FUN=function(x) { 
                       aColumn = read.delim(x,header=T)[,c("MINTbase.Unique.ID","Unnormalized.read.counts")];
                       colnames(aColumn)[2] = x;
                       aColumn;
                     }
             )
)
DF = DF[,!duplicated(colnames(DF))]

'''

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。