微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

具有 cauchit 链接函数的二项式广义线性模型的置信区间

如何解决具有 cauchit 链接函数的二项式广义线性模型的置信区间

Gavin Simpson hereherehere 已充分讨论了计算广义线性模型 (GLM) 置信区间 (CI) 的正确方法。但是,提供的二项式示例始终涉及 logit 链接函数,即逻辑回归。我想使用 cauchit 链接函数为我的数据建模,该函数基于 Cauchy distribution (y = atan(ax + b)/pi + 0.5) 的累积分布函数 (CDF)。此链接功能很少使用,但在我的情况下非常适合。所以我在 cauchit 二项式 GLM 上尝试了 Gavin Simpson 的方法。这是在 R 中使用 these data 的最小可重现示例。

wasp <- read.csv("wasp.csv",skip = 1)
mod <- glm(visited ~ leafheight,data = wasp,family = binomial(link = "cauchit"))
summary(mod)

new <- with(wasp,data.frame(leafheight = seq(min(leafheight),max(leafheight),by = 1)))
inv <- family(mod)$linkinv # extract the inverse of the cauchit link function
predicted <- predict(mod,type = "link",se.fit = TRUE,newdata = new)
# fit
new$fit <- inv(predicted$fit)
# 99% CI
new$upper <- inv(new$fit + predicted$se.fit * qnorm(0.995)) 
new$lower <- inv(new$fit - predicted$se.fit * qnorm(0.995))

require(ggplot2)
ggplot(new,aes(leafheight,fit)) +
  geom_line() +
  geom_ribbon(aes(ymin = lower,ymax = upper),alpha = 0.5) +
  theme_minimal()

enter image description here

显然,这看起来不对!我也对其他数据尝试了这种方法,但总是得到相同的无法使用的 CI。使用反向链接函数方法似乎不适用于 cauchit GLM。

本质上,我想围绕 cauchit GLM 的预测值计算 95% 和 99% 的 Wilson 得分 CI,以避免 normal approximation intervals 的已知问题。 This answer 表明可以使用 binom::binom.confint(method = "wilson") 计算 Wilson CI。但是,我不知道如何将这个 R 函数应用于具有连续预测变量的示例。是否有一种简单的方法可以使用 cauchit 链接函数计算和绘制二项式 GLM 的可用 CI?还是唯一的解决方案是自举 CI?如果是,我将如何在 R 中实现这一点?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。