微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何找到 R 中哪些预测变量高度相关?给定 3 个预测变量 X1、X2、X3,因变量是 Y

如何解决如何找到 R 中哪些预测变量高度相关?给定 3 个预测变量 X1、X2、X3,因变量是 Y

enter image description here

尝试使用 vif() 函数,但如何获得预测变量对之间的相关性?

适合

解决方法

您可以使用 cor 函数轻松找到变量之间的相关性,并使用包 corrplot

library(corrplot)
df <-
  data.frame(
    x1 = round(runif(100,min = 100,max=170)),x2 = sample(1:10,100,replace = T),x3 = round(runif(100),2),y = round(runif(100),2)
  )

cor(df)
corrplot::corrplot(cor(df),method = "color")
,

如果您只想要相关系数,则可以使用 cor。如果您想全部使用,请使用 sapply:

sapply(data[,c("X1","X2")],function(x) cor(x,data$X3))
,

有很多方法..

创建虚拟数据

df <-
  data.frame(
    x1 = round(runif(100,2)
  )

使用 psych

library(psych)
  pairs.panels(df,method = "pearson",# correlation method
            hist.col = "#00AFBB",density = TRUE,# show density plots
            ellipses = TRUE # show correlation ellipses
            )

使用 GGally 包

library(GGally)

    ##GGally package
        ## Correlation matirx
    
            ggcorr(df,nbreaks = 6,label = TRUE,label_size = 3,color = "grey50")
        ## Correlation Plots
            ggpairs(df,columns = 1: ncol(df),title = NULL,upper = list(continuous = "cor"),lower = list(continuous = "smooth"),mapping = NULL) 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。