方法问题：使用 STATA 基于两个数据集进行匹配/插补

如何解决方法问题：使用 STATA 基于两个数据集进行匹配/插补

我很难通过两次家庭调查找到适合我想做的事情的正确方法。我有两个数据集：

包含社会经济信息 (A1) 和 Z 信息的 X 数据集
包含社会经济信息的 Y 数据集 (A2)

Y 数据集没有 Z 信息，这是我想根据 X 数据集估算的。插补/匹配将基于社会经济信息（A1 和 A2）。哪种方法最好？我研究了带有 MAR 选项的 MI，它们使用混合方法多重插补，但这种方法基于这样一个事实，即您从 SAME 总体中插补缺失值。我不太确定是否可以将这种方法用于我的数据。

如果我的例子太抽象了，那么考虑一下：我有两个家庭调查数据集。 X 有食物、衣服和房屋燃料的支出，但 Y 数据集没有，所以我需要估算这些信息。我可以这样做，因为我在两个数据集中都有与收入、家庭规模、电器所有权等相关的信息。因此，如果数据集 X 和 Y 中这些社会经济特征的边际分布相似，我就可以估算支出数据。

我非常感谢任何帮助 - 即使是 STATA 中可用的命名方法或工具也会非常有帮助！

干杯，

玛尔塔