如何解决在这种情况下,二项式检验或逻辑回归是最好的假设检验吗?
我的任务是设计一个工作框架,以确定投资组合的子细分市场是否有延迟还款百分比。
为简单起见,让我们假设数据如下所示 - 两个级别(1-是和 0-否)的分类数据:
拉斯维加斯 | 逾期付款 |
---|---|
1 | 0 |
1 | 1 |
0 | 1 |
0 | 0 |
1 | 1 |
...等 | ...等 |
因此假设延迟还款的拉斯维加斯百分比高于投资组合,我想评估它是否显着如此。
我的第一个想法是对 las vegas 的人进行二项式检验,以对照人口 % 延迟的预期结果。然而,由于拉斯维加斯的人是更广泛人群的一部分,这可能会违反独立假设吗?即人口影响预期结果。
或者,考虑使用逻辑回归:
glm(`Late Bill Payment` ~ `Las Vegas`,data = mydata,family = "binomial")
查看梯度系数 p 值以确定假设检验的结果。
这两种方法是否正确?或者两者都错了?如果是这样,为什么?还有更好的选择吗? 谢谢!!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。