微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

通过“popgenome”R 包中的 readData 导入 multiVCF 的问题

如何解决通过“popgenome”R 包中的 readData 导入 multiVCF 的问题

我正在尝试使用包“popgenome”和“readData”将 multiVCF 文件(使用 GATK 创建,约 80 个人(4.3Gb))导入 R。不幸的是,导入总是中止并显示错误消息:“R 遇到致命错误,会话终止”。对于较小的数据集,它可以正常工作。

我也尝试过使用压缩的 vcfs (bgzip) – 对我也不起作用。 我错过了什么吗?我的电脑是否没有足够的计算资源?

有没有人有过类似的经历或知道如何解决这个问题?关于任何建议,我将不胜感激。

亲切的问候

帕夫洛

我的代码

 gff3_out = c()
    my_filter = c()
    for(chr in chromosomes){
    my_filter <- list(seqid=chr)  
    gff3_out <- file.path(gff_path,paste(chr,".gff",sep=""))
    export(readGFF("/path/to/my/gff.gff",filter=my_filter),gff3_out)  
    }
    PopGenome::VCF_split_into_scaffolds("my_multiVCF_from_GATK.vcf","scaffoldVCFs2")
    allgenomes <- PopGenome::readData("path/to/data/with_VCFs",format="VCF",gffpath = "path/to/data/gff_data",big.data = TRUE)

我的电脑:

Windows 10
Intel(R) Core(TM) i7-8565U cpu @ 1.80GHz   1.99 GHz;
RAM 32,0 GB (31,9 GB verwendbar);
Systemtyp   64-Bit-Betriebssystem,x64-basierter Prozessor

解决方法

我现在尝试在另一台 Windows 机器上/全新的 R 安装,不幸的是出现了同样的错误。

我还在 readData 读取记录时检查了 Windows 内存使用情况,但没有表明 RAM 不足可能是导致崩溃的原因。

在那之后,我在 Linux 服务器上使用 PopGenomereadData 读取数据并且它运​​行得非常好。

我的临时解决方案是 - Linux 服务器。但是,我仍然不知道 readData 无法处理更大的数据集是 Windows 版本的 R,还是一般的 Windows。也许有人可以回答这个问题。实际上,很遗憾您不能在 Windows 上对更大的数据集使用如此有吸引力的 R 包/函数(至少在我的情况下)。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?