如何解决具有多重插补的倾向得分匹配
我有一个包含几个缺失值的数据集,需要使用变量“y”作为处理变量和 x1、x2 和 x3 作为调整变量运行倾向得分匹配。 通过在 Matchit 中使用以下代码
ModMatch <- matchit(y ~ x1+x2+x3,method = 'nearest',data = data)
我收到错误“数据中存在缺失值”
因此,我尝试使用小鼠进行多重插补:
ImputedDF <- mice(data)
ModMatch <- matchit(y ~ x1+x2+x3,data = ImputedDF)
并且我收到错误消息“无法将类 mids 的对象强制转换为数据帧”。 我可能需要一种打印估算数据框的方法,有人知道这是否可行吗?
解决方法
您应该使用 MatchThem
包,它是专门为在多次插补后执行匹配而设计的。 matchthem()
函数调用 matchit()
并在每个插补数据集中执行匹配。然后,您可以使用 cobalt
包检查估算数据集中的余额,该包旨在与 MatchThem
兼容。之后,您可以使用 with()
中的 MatchThem
函数来估计效果。以下是此工作流程的示例:
library(mice); library(MatchThem); library(cobalt)
#Impute the data with 20 imputations (more is better)
imp <- mice(data,m = 20)
#Perform matching within each imputation
ModMatch <- matchthem(y ~ x1+x2+x3,method = 'nearest',data = imp)
#Assess balance
bal.tab(ModMatch,un = TRUE)
love.plot(Modmatch)
#Estimate the effect
summary(pool(with(ModMatch,svyglm(outcome ~ y + x1 + X2 + X2))))
我要提醒您的是,您正在使用高级统计技术,未经高级培训的人不应使用这些技术。在 mice
和 MatchThem
中使用默认值很少是一个好主意。
关于您收到的错误消息:调用 mice()
的输出不是数据帧;它是一个 mids
对象。 data
中的 matchit()
参数需要一个数据框。 matchthem()
接受一个 mids
对象以在每个插补数据集中执行匹配。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。