微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

为什么 vglm 中的变量顺序对 Hosmer Lemeshow 检验有影响?

如何解决为什么 vglm 中的变量顺序对 Hosmer Lemeshow 检验有影响?

我正在研究具有序数响应的广义线性模型,但我遇到了与 Hosmer Lemeshow 测试似乎有些偏差的问题。我想知道是否有人可以解释为什么我为同一个模型得到不同的值。

首先,我在 R 中的 faraway 包中加载了债务数据集,并清理了数据以仅包含我想要在我的模型中使用的变量而不会丢失值。然后我在所需的变量上运行 vglm 函数。问题是,我第二次运行时将它们按不同的顺序排列,当我在两个模型上运行 Generalized Hosmer Lemeshow 测试时,我得到了不同的值。请注意,我没有在两个模型中使用不同的变量,当我找到两个模型的摘要时,我得到了相同的参数估计。

library(faraway)
data(debt)

debt <- data.frame(cbind(debt$incomegp,debt$agegp,debt$bankacc,debt$ccarduse))
colnames(debt) <- c("incomegp","agegp","bankacc","ccarduse")
debt <-na.omit(debt)

#Bank Account at the beginning of the predictor list
po_model1 <- vglm(as.ordered(ccarduse)~ bankacc + agegp + incomegp,data=debt,family=cumulative(parallel=TRUE))

#Bank Account at the end of the predictor list
po_model2 <- vglm(as.ordered(ccarduse)~ agegp + incomegp + bankacc,family=cumulative(parallel=TRUE))

library(generalhoslem)
logitgof(debt$ccarduse,fitted(po_model1),g=10,ord=T) #Gives a test statistic of 24.573
logitgof(debt$ccarduse,fitted(po_model2),ord=T) #Gives a test statistic of 19.229

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。