微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

添加交互项时的多重共线性问题

如何解决添加交互项时的多重共线性问题

这更多是一个一般的统计问题,而不是我的代码有问题(尽管经常发生)。因此,情况如下:

我已使用 glmer 函数(lme4软件包)使用以下代码拟合了逻辑模型:

library(lme4)
library(ggplot2)
library(see)
library(Ggally)
library(performance)

## Preparing the data 
## Moose presence
Moose_pr2 <- read.delim(file.choose(),header = T)
Moose_pr2$Forest_stage <- factor(Moose_pr2$Forest_class,levels = c(1:4),labels = c("Clearcut","Young","Thinned","Mature"))
Moose_pr2$Wolf_presence <- factor(Moose_pr2$Wolf.territory,levels = c(0:1),labels = c("Absent","Present"))
Moose_pr2$Moose_presence<- factor(Moose_pr2$Moose.presence,"Present"))
Moose_pr2$distance_forest_roads <- Moose_pr2$Small.roads/1000
Moose_pr2$distance_main_roads <- Moose_pr2$Big.roads/1000
Moose_pr2$RAWO_presence<- factor(Moose_pr2$RASE.presence,"Present"))```

#Select variables of interest 
Moose.data<- Moose_pr2 %>%
  select(Taxar,Moose_presence,Wolf_presence,Forest_stage,distance_main_roads,distance_forest_roads,Pine_proportion,RAWO_presence)

## Run the logistic model
Moose_presence2 <- glmer(Moose_presence~Wolf_presence*Forest_stage + distance_main_roads + distance_forest_roads +
              Pine_proportion + RAWO_presence + (1|Taxar),data = Moose.data,family = binomial(link = "logit"),na.action = "na.fail")

#Check for collinearity
a <- check_collinearity(Moose_presence2)
plot(a)
a

这是共线性检查的结果:

# Check for multicollinearity

Low Correlation

             Parameter  VIF Increased SE
   distance_main_roads 1.06         1.03
 distance_forest_roads 1.08         1.04
       Pine_proportion 1.18         1.09
         RAWO_presence 1.07         1.03

Moderate Correlation

    Parameter  VIF Increased SE
 Forest_stage 5.71         2.39

High Correlation

                  Parameter   VIF Increased SE
              Wolf_presence 25.39         5.04
 Wolf_presence:Forest_stage 76.92         8.77
> 

现在,当包括交互项时,不同变量之间根本就没有共线性。

Moose_presence2 <- glmer(Moose_presence~Wolf_presence+Forest_stage + distance_main_roads + distance_forest_roads +
              Pine_proportion + RAWO_presence + (1|Taxar),na.action = "na.fail")

#Collinearirty check result
Low Correlation

             Parameter  VIF Increased SE
         Wolf_presence 1.02         1.01
          Forest_stage 1.21         1.10
   distance_main_roads 1.06         1.03
 distance_forest_roads 1.08         1.04
       Pine_proportion 1.18         1.09
         RAWO_presence 1.07         1.03

我想知道下一步应该做什么。我该如何解释?多重共线性仅仅是相互作用项的结果吗?可以不理会它,还是可以以某种方式解决它?我知道可以使用居中平均值对连续变量进行标准化,但这对因子变量确实不起作用吗?

重要的是,如果因子变量作为整数变量而不是因子作为整数变量包含在模型中,则根本不存在共线性问题。

如果有人遇到类似问题,或者比我更了解因子变量之间的多重共线性和相互作用项,我将非常感谢您的帮助! 非常感谢

乔治亚州

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。