如何解决为什么在更改样本的分箱时,两样本 KS 测试会给出相同的结果?
我必须测试两个样本的分布以检查它们是否相同,因此我使用了 Scipy 的 Kolmogorov-Smirnov 测试 ks_2samp
。两个样本中的数据是连续的,但为了绘图目的我将它们分箱。
我知道 KS 不能正常处理分箱样本,但我试图看看在测试分箱数据时会发生什么。即,我为每个 bin 分配了一个字母,并传递给 ks_2samp
两个数组,其中字母对应于数据点所属的 bin。
为什么如果我更改箱数,KS 测试会产生(几乎)相同的统计值和 p 值?例如,如果我减少 bin 数量,生成的直方图(以及 pdf)会改变形状,因此我预计测试结果会有所不同。
另外,哪种统计检验最适合检验两个分箱数据样本的分布?
谢谢!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。