如何解决通过“popgenome”R 包中的 readData 导入 multiVCF 的问题
我正在尝试使用包“popgenome”和“readData”将 multiVCF 文件(使用 GATK 创建,约 80 个人(4.3Gb))导入 R。不幸的是,导入总是中止并显示错误消息:“R 遇到致命错误,会话终止”。对于较小的数据集,它可以正常工作。
我也尝试过使用压缩的 vcfs (bgzip) – 对我也不起作用。 我错过了什么吗?我的电脑是否没有足够的计算资源?
有没有人有过类似的经历或知道如何解决这个问题?关于任何建议,我将不胜感激。
亲切的问候
帕夫洛
我的代码:
gff3_out = c()
my_filter = c()
for(chr in chromosomes){
my_filter <- list(seqid=chr)
gff3_out <- file.path(gff_path,paste(chr,".gff",sep=""))
export(readGFF("/path/to/my/gff.gff",filter=my_filter),gff3_out)
}
PopGenome::VCF_split_into_scaffolds("my_multiVCF_from_GATK.vcf","scaffoldVCFs2")
allgenomes <- PopGenome::readData("path/to/data/with_VCFs",format="VCF",gffpath = "path/to/data/gff_data",big.data = TRUE)
我的电脑:
Windows 10
Intel(R) Core(TM) i7-8565U cpu @ 1.80GHz 1.99 GHz;
RAM 32,0 GB (31,9 GB verwendbar);
Systemtyp 64-Bit-Betriebssystem,x64-basierter Prozessor
解决方法
我现在尝试在另一台 Windows 机器上/全新的 R 安装,不幸的是出现了同样的错误。
我还在 readData
读取记录时检查了 Windows 内存使用情况,但没有表明 RAM 不足可能是导致崩溃的原因。
在那之后,我在 Linux 服务器上使用 PopGenome
和 readData
读取数据并且它运行得非常好。
我的临时解决方案是 - Linux 服务器。但是,我仍然不知道 readData
无法处理更大的数据集是 Windows 版本的 R,还是一般的 Windows。也许有人可以回答这个问题。实际上,很遗憾您不能在 Windows 上对更大的数据集使用如此有吸引力的 R 包/函数(至少在我的情况下)。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。