如何解决SAS PROC GENMOD - 为什么一致的语法会为两个不同的二进制变量生成不同的引用类别?
我正在 PROC GENMOD 中运行一系列二元对数二项式回归,每个模型使用相同的结果和一个二元 (1/0) 预测器。我使用完全相同的语法,仅换出预测变量,并且在其中一个模型中,回归用于预测类别 1 与预测类别 0,而在另一个模型中,则相反。会发生什么?
我的预测变量是:
Housing_Insecure_Dich_BL: 0 = 否, 1 = 是
PrEP_Effic_Risk_Red_binary_BL: 0 = 低于 90%, 1 = 90%+
模型 1:
proc genmod data=full3 descending;
class Housing_Insecure_Dich_BL (ref=first);
model Almost_Always_Take_3m = Housing_Insecure_Dich_BL / dist=bin link=log waldci ;
estimate 'Housing_Insecure_Dich_BL' Housing_Insecure_Dich_BL 1 -1/exp;
run;
结果: 类级别信息表将值列为“是否” - 表示它正在比较是与否,即 1 与 0。 鉴于原始百分比,流行率是有道理的。
模型 2:
proc genmod data=full3 descending;
class PrEP_Effic_Risk_Red_binary_BL (ref=first);
model Almost_Always_Take_3m = PrEP_Effic_Risk_Red_binary_BL / dist=bin link=log waldci ;
estimate 'PrEP_Effic_Risk_Red_binary_BL' PrEP_Effic_Risk_Red_binary_BL 1 -1/exp;
run;
结果: 类级别信息表将值列为“低于 90% 90%+” - 意味着它正在将零与一进行比较 - 为什么这样做,当我指定了 ref=first,并且完全相同的语法具有不同的 1 -0 编码变量产生预期的参考类别编码? 流行率符合零对一的预期,但这不是我想要的。
我可以将模型 2 的语法更改为 ref=last 或 ref="Below 90%",但我宁愿了解正在发生的事情并能够使用统一的语法,因为我所有的预测变量都被编码为一样。
有人可以帮忙吗?
解决方法
以下是您可能正在执行的操作的示例。
proc format;
value smokef
0 = 'Nonsmoker'
1 = 'Smoker'
;
value bpf
0 = 'Normal BP'
1 = 'Higher BP'
;
value statusf
0 = 'Dead'
1 = 'Alive'
;
quit;
data heart;
set sashelp.heart;
smokeflag = (smoking ne 0);
bpflag = (bp_status ne 'Normal');
statusflag= (status = 'Alive');
format
smokeflag smokef.
bpflag bpf.
statusflag statusf.
;
run;
proc genmod data=heart;
class smokeflag;
model statusflag = smokeflag;
estimate 'Smokeflag' smokeflag 1 -1/exp;
run;
proc genmod data=heart;
class bpflag;
model statusflag = bpflag;
estimate 'Blood Pressure flag' bpflag 1 -1/exp;
run;
注意同样的问题 - 它比较“非吸烟者吸烟者”(0 1)和“较高血压正常血压”(1 0)。那是因为 GENMOD 的默认 order
是 order=formatted
。 N
在 S
之前,但 H
在 N
...
可以通过更改格式以包含数字(例如 1 Smoker 0 Nonsmoker
等)或使用 order=internal
选项来获得所需的结果:
proc genmod data=heart;
class smokeflag (ref=first order=internal);
model statusflag = smokeflag;
estimate 'Smokeflag' smokeflag 1 -1/exp;
run;
proc genmod data=heart;
class bpflag (ref=first order=internal);
model statusflag = bpflag;
estimate 'Blood Pressure flag' bpflag 1 -1/exp;
run;
order=internal
告诉 SAS 使用未格式化的顺序。
某些过程还支持使用 notsorted
保存的格式,但在我的测试中,这在 GLM 上不可用(通常在 preloadfmt
可用时可用)。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。