微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Python:卡方应变测试如何解读

如何解决Python:卡方应变测试如何解读

我已经完成了如下卡方应变测试的练习,但我在如何解释结果方面遇到了问题。 下面的测试结果表明 p-val = 0。 那么这是否意味着两个变量不是独立的? 由于它是一个小数据,我认为很确定变量是独立的。 p-val 为 0 似乎很奇怪。 我做错了吗??

import pandas as pd
df = pd.DataFrame({
    "~60m2" : [54,577,143,782],"60~85m2" : [2,735,1437,1],"85m2~" : [0,142,44,0],})
df.index = ["A","B","C","D"]
df.columns.names = ["size"]
df.index.names = ["city"]

from scipy import stats
stats.chi2_contingency(df)

输出

(2064.576731417199,0.0,6,array([[ 22.24559612,31.09522594,2.65917794],[577.59101353,807.36533061,69.04365586],[645.12228746,901.76155221,77.11616033],[311.04110288,434.77789124,37.18100587]]))

解决方法

我觉得是对的。你们的城市很不一样。只需尝试按行标准化:

(df.T / df.sum(axis=1)).T                                             

size     ~60m2   60~85m2     85m2~
city                              
A     0.964286  0.035714  0.000000
B     0.396836  0.505502  0.097662
C     0.088054  0.884852  0.027094
D     0.998723  0.001277  0.000000

每一行都与其他行非常不同,所以是的,城市似乎不同,即从不同的人群中抽样。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。