微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何拟合简单计数数据以进行建模以生成新数据集

如何解决如何拟合简单计数数据以进行建模以生成新数据集

我以数据向量PC6的形式设置了简单的计数数据。我试图识别分布,以便为仿真创建伪生成器。我数据的频率表是

> table(PC6)
PC6
 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 23 26 28 29 30 31 32 34 36 
96 45 38 60 40 47 37 26 32 16 12 13 12 11  6  4  4  5  1  1  2  2  1  1  1  2  1  1  1  1  1 
41 48 59 64 
 1  1  1  1

enter image description here

我定义了几个模型,以便识别AIC来比较模型并找到最佳匹配。由于可能的零比例很大,因此我加入了“零膨胀”模型和障碍模型。我的模型是:

> pc6zip <- zeroinfl(PC5 ~ 1|1,dist = "poisson")
> pc6zinb <- zeroinfl(PC6 ~ 1|1,dist = "negbin")
> pc6nb <- fitdistr(PC6,"negative binomial")
> pc6pois <- fitdistr(PC6,"poisson")
> pc6hurdle <- hurdle(PC6 ~ 1|1,dist = "poisson",zero.dist = "poisson")

> AIC(pc6hurdle,pc6nb,pc6pois,pc6zinb,pc6zip)
          df      AIC
pc6hurdle  2 4092.290
pc6nb      2 2957.367
pc6pois    1 4794.918
pc6zinb    3 2951.646
pc6zip     2 3286.346

我看到负二项式和零膨胀负二项式非常接近。如果我正确地完成了这一部分,我的问题是我如何生成将遵循此ZINB模型的新日期集,因为我只有这个参数theta

> summary(pc6zinb)

Call:
zeroinfl(formula = PC6 ~ 1 | 1,dist = "negbin")

Pearson residuals:
    Min      1Q  Median      3Q     Max 
-0.9387 -0.7732 -0.2767  0.3853  9.6531 

Count model coefficients (negbin with log link):
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  1.82669    0.05153  35.446   <2e-16 ***
Log(theta)   0.23829    0.12304   1.937   0.0528 .  

Zero-inflation model coefficients (binomial with logit link):
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  -2.3489     0.3354  -7.004 2.48e-12 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Theta = 1.2691 
Number of iterations in BFGS optimization: 13 
Log-likelihood: -1473 on 3 Df

如果我看一下这个负二项式模型,我会得到这个输出

Call:
glm.nb(formula = PC6 ~ 1,init.theta = 0.9328223932,link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.9109  -1.1309  -0.2927   0.3290   3.6570  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  1.73550    0.04881   35.56   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(dispersion parameter for Negative Binomial(0.9328) family taken to be 1)

    Null deviance: 603.94  on 523  degrees of freedom
Residual deviance: 603.94  on 523  degrees of freedom
AIC: 2957.4

Number of Fisher Scoring iterations: 1


              Theta:  0.9328 
          Std. Err.:  0.0714 

 2 x log-likelihood:  -2953.3670 

由于AIC确实很接近,您是否认为负二项式是更好的模型,以及如何使用此theta参数生成遵循ZINB模型的新数据集

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。