如何解决Stata 如何处理回归中的多因子变量?
我有一个城市年级别的数据集,并使用城市固定效应运行以下回归:
reg y x i.city
我认为这相当于为数据中的 300 个城市中的每一个生成一个虚拟变量,并运行(城市 1 作为基础级别):
reg y x city2 ... city300
但是,我还需要包括年份假人。我使用以下方法获得估计值:
reg y x i.city i.year
有谁知道这个回归矩阵形式背后的原因是什么?这与每年生成一个虚拟对象并运行以下相同吗?
reg y x city2 ... city300 year2 ... year20
我想这样做的原因是尝试使用矩阵运算 (X'X)^{-1}(X'y) 从头开始编写命令,其中 X 包括城市虚拟变量和年份虚拟变量。
解决方法
您使用的是虚拟(0,1) 变量的角点编码,其中k-1 二进制(0,1) 变量级别用于每个因子(分类变量)。如果您指定不应使用常数项:
reg y x i.city i.year,nocon
然后将和到零约束编码用于二元变量构造,其中 X 矩阵中将使用 city1 和 year1 的二元变量。
如您所见(下图),当饮食 (retdiet) 中的视黄醇浓度在 male
虚拟变量上回归时,常数 (y-intcp) 的系数项是女性中的平均 y (815) ,male
的系数是男性和女性之间 y 值的增量。然而,当使用两个虚拟指标时 - fem
和 male
,并且指定了 ,nocon
(在逗号之后),fem
和 {{ 1}} 是每组中 y (retdiet) 的平均值。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。