微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

方法问题:使用 STATA 基于两个数据集进行匹配/插补

如何解决方法问题:使用 STATA 基于两个数据集进行匹配/插补

我很难通过两次家庭调查找到适合我想做的事情的正确方法我有两个数据集:

  1. 包含社会经济信息 (A1) 和 Z 信息的 X 数据集
  2. 包含社会经济信息的 Y 数据集 (A2)

Y 数据集没有 Z 信息,这是我想根据 X 数据集估算的。插补/匹配将基于社会经济信息(A1 和 A2)。哪种方法最好?我研究了带有 MAR 选项的 MI,它们使用混合方法多重插补,但这种方法基于这样一个事实,即您从 SAME 总体中插补缺失值。我不太确定是否可以将这种方法用于我的数据。

如果我的例子太抽象了,那么考虑一下:我有两个家庭调查数据集。 X 有食物、衣服和房屋燃料的支出,但 Y 数据集没有,所以我需要估算这些信息。我可以这样做,因为我在两个数据集中都有与收入、家庭规模、电器所有权等相关的信息。因此,如果数据集 X 和 Y 中这些社会经济特征的边际分布相似,我就可以估算支出数据。

我非常感谢任何帮助 - 即使是 STATA 中可用的命名方法或工具也会非常有帮助!

干杯,

玛尔塔

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。