如何解决Python 中的多重假设
我想编写一种方法来测试一对学校(比如 TAMU 和 UT Austin)的多个假设。我想考虑所有可能的单词对(Research Thesis Proposal AI Analytics),并使用指定的 alpha (0.05) 阈值测试两个学校的单词数显着不同的假设。
只需要对两所学校都具有非零值的单词进行测试。即列联表中的每一行和每一列的总和应为 >0。
最后,想要返回一个元组,其中包含 (i) 进行的测试总数,以及 (ii) 重要测试的数量。
df:
Names Research Thesis Proposal AI Analytics Data
TAMU 54 0 0 6 5 0
uiuc 33 43 5 0 76 81
USC 4 1 0 7 21 4
UT Austin 22 31 0 0 55 0
UCLA 55 6 7 9 11 12
from scipy.stats import chi2_contingency
def school_term_hypotheses(filename,college1,college2,alpha):
df=pd.read_csv(filename)
df=df[(df['Name'] == college1) | (df['Name'] == college2)]
df=df.loc[:,df.ne(0).all()]
df=df.set_index('Unnamed: 0')
#chi,p=chi2_contingency(df)[:2]
#return(p)
school_term_hypotheses("test.csv",'TAMU','UT Austin' 0.05)
在获得非零值的 df 后,我不知道该怎么做。需要一些帮助来确定如何检验多个假设。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。