微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何分析 R 中插补输出的有用性

如何解决如何分析 R 中插补输出的有用性

我正在处理一个包含 3,500 个观测值的数据集,其中包含一个体重指数变量。 BMI 变量有大约 300 个 NA 值,我使用多重插补法进行了插补。抱歉,这是不可重现的,不知道在这种情况下如何快速做到这一点。这是我用来估算数据的代码

a1 <- amelia(x = df,m = 30,idvars = c("EDUC_1","REGION_3"),noms=c("REGION_1","REGION_2","REGION_4","SMOKE","MARRIED","NON_WHITE","MOD_SEV_ANX","HYPERTEN","DIABETES","BELOW_100_POVERTY","IMMIGRANT","FEMALE","EDUC_2","EDUC_3","EDUC_4","EDUC_5"),p2s = 0)
a1
imp.mod <- zelig(BMICALC ~ AGE+FAMSIZE+factor(BELOW_100_POVERTY)+factor(IMMIGRANT)
                  +factor(FEMALE)+factor(EDUC_2)+factor(EDUC_3)
                  +factor(EDUC_4)+factor(EDUC_5)+factor(REGION_1)+factor(REGION_2)+factor(REGION_4)+
                   factor(SMOKE)+factor(MARRIED)+factor(NON_WHITE)+factor(MOD_SEV_ANX)+factor(HYPERTEN)+
            factor(DIABETES),model = "ls",data = a1,cite = F)
summary(imp.mod)

这是输出

enter image description here

从此 website here 我找到了有关如何解释插补是否需要更多调查,或者我是否可以使用回归模型继续分析数据的信息。我已经包含了根据网站说明创建 2 个视觉效果代码,但我不清楚如何解释插补是否准确。第一张图中的两个分布是否需要接近?有人可以澄清第二张图片中 y=x 线和蓝色置信区间/点的含义吗?这里的输出是否表明插补是否足以用于回归分析?我在下面附上了代码输出。谢谢!

compare.density(a1,var = "BMICALC")

enter image description here

overimpute(a1,var = "BMICALC")

enter image description here

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。