多元数据集中对总异质性的变量贡献

如何解决多元数据集中对总异质性的变量贡献

我想找到一种统计方法（在R中），以评估多元数据集中一个（或多个）变量对同一数据集的总异质性的贡献。

在下面，我尝试用ade4 R包中的“ doubs”数据集的环境部分作为玩具数据集来制作一个可重现的示例。

library(ade4)
# This data set gives environmental variables,fish species and spatial coordinates for 30 sites.
data("doubs")

# extacting the environmental variables
env_heterogeneity <- doubs$env
head(env_heterogeneity)

# selecting 2 groups of environmental parameters
env_heterogeneity_physical <- env_heterogeneity[,1:4] # physical/morphology parameters
env_heterogeneity_chemical <- env_heterogeneity[,5:11] # chemical parameters

考虑这个数据集，我考虑了两组环境参数，它们收集了法国河流的物理（PH）和化学（CH）参数。我想评估总异质性的哪一部分（CH + PH）由一组（CH或PH）的异质性解释。我首先考虑在vegan R包中使用冗余分析，将一组参数（X = PH）与整个数据集（Y = PH + CH）进行比较。我得到以下结果：

# how physical parameters can describe the total variability of chemical and physical parameters ?
library(vegan)
RDA_1 <- rda(X = env_heterogeneity_physical,Y = env_heterogeneity[,1:11],scale = T)
summary(RDA_1)
# Call:
#   rda(X = env_heterogeneity_physical,Y = cbind(env_heterogeneity_physical,env_heterogeneity_chemical),scale = T) 
# 
# Partitioning of correlations:
#   Inertia Proportion
# Total               4          1
# Constrained         4          1
# Unconstrained       0          0

这个结果是出乎意料的，因为如果我们运行另一个RDA比较两组参数（X = PH，Y = CH），我可以看到这两组参数确实是不同的并且具有一定的特异性：

RDA_2 <- rda(X = env_heterogeneity_physical,Y = env_heterogeneity_chemical)
summary(RDA_2)
# 
# Call:
#   rda(X = env_heterogeneity_physical,Y = env_heterogeneity_chemical) 
# 
# Partitioning of variance:
#   Inertia Proportion
# Total         5300660     1.0000
# Constrained   3786549     0.7144
# Unconstrained 1514111     0.2856

我得出的结论是，我只是错误地使用了RDA，因此我应该找到另一种统计方法。与我发现的大多数研究相比，我没有反应矩阵，而且我认为这很不寻常...

您认为统计方法可以做到我想解释的吗？