逻辑回归 - 使用其他变量创建新变量 (SAS)

如何解决逻辑回归 - 使用其他变量创建新变量 (SAS)

我有一个基于调查的小数据集（大约 80 obsv），我想使用 SAS 对其进行逻辑回归。

我的调查包含一些变量（名为 X1、X2、X3），我想将它们重新组合为名为 X4 的新创建变量的类别。

问题是那些变量X1-X3已经有了类别（YES/NO/WITHOUT OPINION）

如何将它们重新组合为 X4 的类别，但考虑到它们具有的值？

帮助您理解我的问题：

Y(=1/0) = X1 X2 X3

X1-X3 各有 3 个类别（是/否/无意见）

我想要的是 :

Proc 逻辑数据 = 有；模型 Y = X4 以及其他诸如年龄、城市...但 X4 可以取 3 个值。

问题不是基于 X1-X3 创建 X4，而是如何影响 X4 X1-X3 每个取的值？

（注意：我说 X1-X3 但它更多）

我在 SAS 中这样做，但即使是理论上的解释也会有帮助！

谢谢。

解决方法

我认为大部分评论是正确的 - 这可能无助于您的回归。

但是 - 回答如何从字面上做到这一点；通常你会做的是使用 2（或 3）的幂。

因此，对于您不关心第三个的典型“是/否”，您可以分配如下内容：

x4 = (x1) + (x2 * 2) + (x3 * 4);

那么值将是这样的：

0 = (0,0)
1 = (1,0)
2 = (0,1,0)
3 = (1,0)
4 = (0,1)
5 = (1,1)
6 = (0,1)
7 = (1,1)

如果您确实希望将“没有意见”作为一个类别（这很复杂，但在许多情况下将“没有意见”的人包括在内并不理想，除非有意见实际上是相关的，最好将他们排除在外或来估算值），那么您将使用 3 的幂来执行此操作。它的工作方式与 2 的幂相同，只是您有更多的类别组合（总共 27 个）。

x4 = (x1) + (x2 * 3) + (x3 * 9);

只要确保它们是 0/1/2 编码，而不是 1/2/3；如果它们是 1/2/3，则在乘法过程中减一。

还有什么比这更好的吗？理论上你可以做很多比这个实际分类更好的事情（这真的对你的过度拟合没有任何帮助）。

一个有用的术语是“崩溃”；例如，参见 this paper by Bruce Lund et al（插件：Bruce 为 WUSS later this month 提供了一个（非免费）回归类。您可以使用 ANOVA 来分析哪些变量对您的模型有贡献。您可以也可以使用其他一些过程，例如 GLMSELECT；这通常是回归中的一个主要主题。

您还可以查看因子分析，例如 this SAS Book excerpt。

逻辑回归 - 使用其他变量创建新变量 (SAS)

如何解决逻辑回归 - 使用其他变量创建新变量 (SAS)

解决方法

相关推荐