如何解决多元数据集中对总异质性的变量贡献
我想找到一种统计方法(在R
中),以评估多元数据集中一个(或多个)变量对同一数据集的总异质性的贡献。
在下面,我尝试用ade4
R
包中的“ doubs”数据集的环境部分作为玩具数据集来制作一个可重现的示例。
library(ade4)
# This data set gives environmental variables,fish species and spatial coordinates for 30 sites.
data("doubs")
# extacting the environmental variables
env_heterogeneity <- doubs$env
head(env_heterogeneity)
# selecting 2 groups of environmental parameters
env_heterogeneity_physical <- env_heterogeneity[,1:4] # physical/morphology parameters
env_heterogeneity_chemical <- env_heterogeneity[,5:11] # chemical parameters
考虑这个数据集,我考虑了两组环境参数,它们收集了法国河流的物理(PH)和化学(CH)参数。我想评估总异质性的哪一部分(CH + PH)由一组(CH或PH)的异质性解释。我首先考虑在vegan
R
包中使用冗余分析,将一组参数(X = PH)与整个数据集(Y = PH + CH)进行比较。我得到以下结果:
# how physical parameters can describe the total variability of chemical and physical parameters ?
library(vegan)
RDA_1 <- rda(X = env_heterogeneity_physical,Y = env_heterogeneity[,1:11],scale = T)
summary(RDA_1)
# Call:
# rda(X = env_heterogeneity_physical,Y = cbind(env_heterogeneity_physical,env_heterogeneity_chemical),scale = T)
#
# Partitioning of correlations:
# Inertia Proportion
# Total 4 1
# Constrained 4 1
# Unconstrained 0 0
这个结果是出乎意料的,因为如果我们运行另一个RDA比较两组参数(X = PH,Y = CH),我可以看到这两组参数确实是不同的并且具有一定的特异性:
RDA_2 <- rda(X = env_heterogeneity_physical,Y = env_heterogeneity_chemical)
summary(RDA_2)
#
# Call:
# rda(X = env_heterogeneity_physical,Y = env_heterogeneity_chemical)
#
# Partitioning of variance:
# Inertia Proportion
# Total 5300660 1.0000
# Constrained 3786549 0.7144
# Unconstrained 1514111 0.2856
我得出的结论是,我只是错误地使用了RDA,因此我应该找到另一种统计方法。与我发现的大多数研究相比,我没有反应矩阵,而且我认为这很不寻常...
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。