具有 cauchit 链接函数的二项式广义线性模型的置信区间

如何解决具有 cauchit 链接函数的二项式广义线性模型的置信区间

Gavin Simpson here、here 和 here 已充分讨论了计算广义线性模型 (GLM) 置信区间 (CI) 的正确方法。但是，提供的二项式示例始终涉及 logit 链接函数，即逻辑回归。我想使用 cauchit 链接函数为我的数据建模，该函数基于 Cauchy distribution (y = atan(ax + b)/pi + 0.5) 的累积分布函数 (CDF)。此链接功能很少使用，但在我的情况下非常适合。所以我在 cauchit 二项式 GLM 上尝试了 Gavin Simpson 的方法。这是在 R 中使用 these data 的最小可重现示例。

wasp <- read.csv("wasp.csv",skip = 1)
mod <- glm(visited ~ leafheight,data = wasp,family = binomial(link = "cauchit"))
summary(mod)

new <- with(wasp,data.frame(leafheight = seq(min(leafheight),max(leafheight),by = 1)))
inv <- family(mod)$linkinv # extract the inverse of the cauchit link function
predicted <- predict(mod,type = "link",se.fit = TRUE,newdata = new)
# fit
new$fit <- inv(predicted$fit)
# 99% CI
new$upper <- inv(new$fit + predicted$se.fit * qnorm(0.995)) 
new$lower <- inv(new$fit - predicted$se.fit * qnorm(0.995))

require(ggplot2)
ggplot(new,aes(leafheight,fit)) +
  geom_line() +
  geom_ribbon(aes(ymin = lower,ymax = upper),alpha = 0.5) +
  theme_minimal()

显然，这看起来不对！我也对其他数据尝试了这种方法，但总是得到相同的无法使用的 CI。使用反向链接函数的方法似乎不适用于 cauchit GLM。

本质上，我想围绕 cauchit GLM 的预测值计算 95% 和 99% 的 Wilson 得分 CI，以避免 normal approximation intervals 的已知问题。 This answer 表明可以使用 binom::binom.confint(method = "wilson") 计算 Wilson CI。但是，我不知道如何将这个 R 函数应用于具有连续预测变量的示例。是否有一种简单的方法可以使用 cauchit 链接函数计算和绘制二项式 GLM 的可用 CI？还是唯一的解决方案是自举 CI？如果是，我将如何在 R 中实现这一点？