如何解决错误信息:Cube::init():请求的大小太大;建议使用 GWAS 的 sommer 包启用 ARMA_64BIT_WORD
来自 sessionInfo() 的输出
R version 4.0.5 (2021-03-31)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)
Matrix products: default
locale:
[1] LC_COLLATE=English_United States.1252 LC_CTYPE=English_United States.1252 LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C LC_TIME=English_United States.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] sommer_4.1.4 crayon_1.4.1 lattice_0.20-41 MASS_7.3-53.1 Matrix_1.3-2 data.table_1.14.0
loaded via a namespace (and not attached):
[1] compiler_4.0.5 tools_4.0.5 rstudioapi_0.13 Rcpp_1.0.6 grid_4.0.5
我一直在尝试使用带有以下代码的 sommer 包执行 gwas:
var_cov <- A.mat(m_matrix) ## aditive relationship matrix
model <- GWAS(cbind(DW20,PLA07,PLA08,PLA09,PLA10,PLA11,PLA12,PLA13,PLA14,PLA15,PLA16,PLA17,PLA18,RGR07_09,RGR08_10,RGR09_11,RGR10_12,RGR11_13,RGR12_14,RGR13_15,RGR14_16,RGR15_17,RGR16_18,SA,SL,SW) ~ 1,random = ~ vs(accession,Gu = var_cov),data = pheno2,M = m_matrix,gTerm = "u:accession",n.PC = 5)
如代码中所述,我有 26 个特征,我想使用 K+P 模型。我的 SNP 矩阵有 211 260 个标记和 309 个种质。
当我为一个和两个特征运行此代码时,它运行良好。但是,当我尝试使用所有 26 个特征运行时,我收到错误消息:
Error in GWAS(cbind(DW20,:
Cube::init(): requested size is too large; suggest to enable ARMA_64BIT_WORD
上网查了一下,发现这个错误和RcppArmadillo这个包有关。 遵循此处的建议 (http://arma.sourceforge.net/docs.html#config_hpp_arma_64bit_word) 和 在这里 (Large Matrices in RcppArmadillo via the ARMA_64BIT_WORD define),我尝试通过取消注释文件 RcppArmadillo\include\armadillo_bits\config.hpp 中的 #define ARMA_64BIT_WORD(波纹管)行来启用 ARMA_64BIT_WORD:
#if !defined(ARMA_64BIT_WORD)
//#define ARMA_64BIT_WORD
//// Uncomment the above line if you require matrices/vectors capable of holding more than 4 billion elements.
//// Note that ARMA_64BIT_WORD is automatically enabled when std::size_t has 64 bits and ARMA_32BIT_WORD is not defined.
#endiff
并且还在 RcppArmadillo\skeleton 中的 Makevars.win 文件中包含以下行。
PKG_CPPFLAGS = -DARMA_64BIT_WORD=1
所有建议均无效,我继续收到相同的错误消息。我的问题是:是否还有其他选项可以启用我缺少的 ARMA_64BIT_WORD?是否可以在具有多达 26 个特征的 sommer 包中运行 GWAS 函数,或者这个数字太多了?错误消息是否由 GWAS 代码中的错误导致?
非常感谢您。
解决方法
我对 Ana 的第一个看法是,当您使用 cbind() 时,您正在尝试拟合具有 26 个特征的非结构化多元模型,这意味着如果您有 1000 条记录,这将是一个 309 x 26 = 8,034 条记录的模型这对于 sommer 使用的直接反演算法来说有点太大了,而且要估计的参数数量很多(想想所有的协方差参数 (26*25)/2 = 325。我建议为每个特征拟合一个 GWAS在 for 循环中解决您的问题。除非您有充分的理由运行多变量 GWAS,否则您的分析问题比背后的 C++ 代码更重要。例如:
var_cov <- A.mat(m_matrix) ## aditive relationship matrix
traits <- c(DW20,PLA07,PLA08,PLA09,PLA10,PLA11,PLA12,PLA13,PLA14,PLA15,PLA16,PLA17,PLA18,RGR07_09,RGR08_10,RGR09_11,RGR10_12,RGR11_13,RGR12_14,RGR13_15,RGR14_16,RGR15_17,RGR16_18,SA,SL,SW)
for(itrait in traits){
model <- GWAS(as.formula(paste(itrait,"~1")),random = ~ vs(accession,Gu = var_cov),data = pheno2,M = m_matrix,gTerm = "u:accession",n.PC = 5)
}
如果事实证明即使只有一个特征, arma::cube 函数也会出现内存问题,那么我们肯定需要看看为什么 armadillo 库无法处理这些维度。
干杯, 爱德华多
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。