如何解决逻辑回归 - 使用其他变量创建新变量 (SAS)
我有一个基于调查的小数据集(大约 80 obsv),我想使用 SAS 对其进行逻辑回归。
我的调查包含一些变量(名为 X1、X2、X3),我想将它们重新组合为名为 X4 的新创建变量的类别。
问题是那些变量X1-X3已经有了类别(YES/NO/WITHOUT OPINION)
如何将它们重新组合为 X4 的类别,但考虑到它们具有的值?
帮助您理解我的问题:
Y(=1/0) = X1 X2 X3
X1-X3 各有 3 个类别(是/否/无意见)
我想要的是 :
Proc 逻辑数据 = 有; 模型 Y = X4 以及其他诸如年龄、城市...但 X4 可以取 3 个值。
问题不是基于 X1-X3 创建 X4,而是如何影响 X4 X1-X3 每个取的值?
(注意:我说 X1-X3 但它更多)
我在 SAS 中这样做,但即使是理论上的解释也会有帮助!
谢谢。
解决方法
我认为大部分评论是正确的 - 这可能无助于您的回归。
但是 - 回答如何从字面上做到这一点;通常你会做的是使用 2(或 3)的幂。
因此,对于您不关心第三个的典型“是/否”,您可以分配如下内容:
x4 = (x1) + (x2 * 2) + (x3 * 4);
那么值将是这样的:
0 = (0,0)
1 = (1,0)
2 = (0,1,0)
3 = (1,0)
4 = (0,1)
5 = (1,1)
6 = (0,1)
7 = (1,1)
如果您确实希望将“没有意见”作为一个类别(这很复杂,但在许多情况下将“没有意见”的人包括在内并不理想,除非有意见实际上是相关的,最好将他们排除在外或来估算值),那么您将使用 3 的幂来执行此操作。它的工作方式与 2 的幂相同,只是您有更多的类别组合(总共 27 个)。
x4 = (x1) + (x2 * 3) + (x3 * 9);
只要确保它们是 0/1/2 编码,而不是 1/2/3;如果它们是 1/2/3,则在乘法过程中减一。
还有什么比这更好的吗?理论上你可以做很多比这个实际分类更好的事情(这真的对你的过度拟合没有任何帮助)。
一个有用的术语是“崩溃”;例如,参见 this paper by Bruce Lund et al(插件:Bruce 为 WUSS later this month 提供了一个(非免费)回归类。您可以使用 ANOVA 来分析哪些变量对您的模型有贡献。您可以也可以使用其他一些过程,例如 GLMSELECT;这通常是回归中的一个主要主题。
您还可以查看因子分析,例如 this SAS Book excerpt。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。