微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

多重插补MICE,线性回归模型的比较,R平方值

如何解决多重插补MICE,线性回归模型的比较,R平方值

我正在使用R中的MICE包对一个数据集进行多次插补。原始数据帧df1已完成,因此我随机删除了一些数据供我进行多次插补,而缺少值的新数据帧为df2。我的目标是拟合具有独立X和相关Y的线性回归模型。可能会有多个X。

我的第一个问题是,我使用过MICE,而df2的合并线性模型为我提供了以下摘要

term   estimate  std.error statistic       df      p.value
1 (Intercept) -13158.507 2097.63827  -6.27301 162.2513 3.090076e-09
2         bmi   1470.651   66.75598  22.03026 164.3894 0.000000e+00

还有df1(完整数据集)的线性模型,下面给出了我的总结。

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) -13186.58    2052.88  -6.423 5.93e-10 ***
bmi           1473.11      65.48  22.496  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 6837 on 272 degrees of freedom
Multiple R-squared:  0.6504,Adjusted R-squared:  0.6491 
F-statistic: 506.1 on 1 and 272 DF,p-value: < 2.2e-16

那么我该如何比较这2个并生成一些图或数字以告诉我,来自多重插补的线性模型是一个很好的估计,因为它与完整数据集中的线性模型非常相似?

我的第二个问题是,如上所述,您可以看到X只有1个变量bmi。如果我尝试将更多变量拟合到线性模型,该如何判断哪个更合适?在正常数据集中,我将使用调整后的R平方值来帮助我确定哪种模型更好。但是R平方值不在MICE的摘要中,是否有任何代码可以带出R​​平方值?如果没有,我该如何判断哪个更合适?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。