微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在R中使用glm获得“对于二项式比例为95%CI”

如何解决如何在R中使用glm获得“对于二项式比例为95%CI”

我指的是网站Interval Estimation for a Binomial Proportion 在R中使用glm,获得“渐近” 95%CI。 我认为二项式链接没有“身份”,但以下程序可以解决问题。为什么? 如果您知道,请给我一些建议。

此示例,n = 10,x = 2,渐近95%CI

binom.ci<-function(x,n,alpha = 0.05,link="logit"){
z<-qnorm(1-alpha/2)
family<-binomial(link=link)
fit<-summary(glm(cbind(x,n-x)~1,family=family))
est<-fit$coef[,"Estimate"]
se<-fit$coef[,"Std. Error"]
family$linkinv(est+c(-z,z)*se)
}

binom.ci(x=2,n=10,link="identity")
# [1] -0.04791801  0.44791801

解决方法

可以与binomial一起使用“身份”链接功能,但是在这里没有多大意义。如果将示例中的参数复制glm调用,我们可以看到函数内部发生了什么。

fit <- summary(glm(cbind(2,8) ~ 1,family = binomial("identity")))
fit
#> 
#> Call:
#> glm(formula = cbind(2,family = binomial("identity"))
#> 
#> Deviance Residuals: 
#> [1]  0
#> 
#> Coefficients:
#>             Estimate Std. Error z value Pr(>|z|)
#> (Intercept)   0.2000     0.1265   1.581    0.114
#> 
#> (Dispersion parameter for binomial family taken to be 1)
#> 
#>     Null deviance: 0  on 0  degrees of freedom
#> Residual deviance: 0  on 0  degrees of freedom
#> AIC: 4.3947
#> 
#> Number of Fisher Scoring iterations: 2

“身份”链接意味着截距将被直接解释为概率,但问题是从字面上看,这意味着我们的95%置信区间包含负概率,这没有任何意义。我们确实需要在此处使用logit链接以获得正确的答案。

是的,我们可以在此处使用binomial(link = "identity")而不会引发错误,但是对于二项式比例,它不能为我们提供经典的95%置信区间。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。