微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

多元数据集中对总异质性的变量贡献

如何解决多元数据集中对总异质性的变量贡献

我想找到一种统计方法(在R中),以评估多元数据集中一个(或多个)变量对同一数据集的总异质性的贡献。

在下面,我尝试用ade4 R包中的“ doubs”数据集的环境部分作为玩具数据集来制作一个可重现的示例。

library(ade4)
# This data set gives environmental variables,fish species and spatial coordinates for 30 sites.
data("doubs")

# extacting the environmental variables
env_heterogeneity <- doubs$env
head(env_heterogeneity)

# selecting 2 groups of environmental parameters
env_heterogeneity_physical <- env_heterogeneity[,1:4] # physical/morphology parameters
env_heterogeneity_chemical <- env_heterogeneity[,5:11] # chemical parameters

考虑这个数据集,我考虑了两组环境参数,它们收集了法国河流的物理(PH)和化学(CH)参数。我想评估总异质性的哪一部分(CH + PH)由一组(CH或PH)的异质性解释。我首先考虑在vegan R包中使用冗余分析,将一组参数(X = PH)与整个数据集(Y = PH + CH)进行比较。我得到以下结果:

# how physical parameters can describe the total variability of chemical and physical parameters ?
library(vegan)
RDA_1 <- rda(X = env_heterogeneity_physical,Y = env_heterogeneity[,1:11],scale = T)
summary(RDA_1)
# Call:
#   rda(X = env_heterogeneity_physical,Y = cbind(env_heterogeneity_physical,env_heterogeneity_chemical),scale = T) 
# 
# Partitioning of correlations:
#   Inertia Proportion
# Total               4          1
# Constrained         4          1
# Unconstrained       0          0

这个结果是出乎意料的,因为如果我们运行另一个RDA比较两组参数(X = PH,Y = CH),我可以看到这两组参数确实是不同的并且具有一定的特异性:

RDA_2 <- rda(X = env_heterogeneity_physical,Y = env_heterogeneity_chemical)
summary(RDA_2)
# 
# Call:
#   rda(X = env_heterogeneity_physical,Y = env_heterogeneity_chemical) 
# 
# Partitioning of variance:
#   Inertia Proportion
# Total         5300660     1.0000
# Constrained   3786549     0.7144
# Unconstrained 1514111     0.2856 

我得出的结论是,我只是错误地使用了RDA,因此我应该找到另一种统计方法。与我发现的大多数研究相比,我没有反应矩阵,而且我认为这很不寻常...

您认为统计方法可以做到我想解释的吗?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。