如何解决Python计算置信区间
我正在尝试使用以下脚本计算 10,000 个上限和下限置信区间:
import numpy as np
import statistics as stat
from matplotlib import pyplot as plt
N = 10000
sigma = 1
mu = 10
n = 10
X = []
for i in range (N):
X.append(mu + sigma*(np.random.normal(size=n)))
Xbar = np.mean(X,axis=0)
lower_CI = Xbar - 1.96*sigma/np.sqrt(n)
upper_CI = Xbar + 1.96*sigma/np.sqrt(n)
计算间隔后,我需要找到包含 mu = 10 的间隔分数。但是,我只得到 10 个上限和下限间隔,而不是 10,000。此外,Xbar 有 10 个值。为什么它不是只有一个值,因为它是 X 的平均值?
我哪里出错了?
解决方法
首先,您发布的代码中发生了以下情况:
mu + sigma*(np.random.normal(size=n))
为您提供具有 mu 和 sigma 的正态分布的 n=10 样本数组。 X.append(mu + sigma*(np.random.normal(size=n)))
将此添加到您的 X 列表中,以便 X 成为数组列表。 Xbar = np.mean(X,axis=0)
轴 = 0,您告诉 numpy 计算沿数组列表的轴 0 的平均值。这意味着计算数组 X 列表中数组的每个索引的平均值,这就是 Xbar 有 10 个条目的原因。 lower_CI = Xbar - 1.96*sigma/np.sqrt(n)
在这里,您将 lower_CI 设置为 Xbar 减去一些基于 sigma 的数字作为您的置信区间。因为 Xbar 有 10 个条目,所以结果也将有 10 个条目。但是,因为您在 for 循环的每次迭代中都覆盖了 lower_CI,而不是将值存储在列表中,所以您不会得到 10,000 个下限。
我不完全确定您到底要做什么,但以下代码将估计 mu 和 sigma 的置信下限和上限 10,000 次。
lower_CIs = []
upper_CIs = []
for i in range (N):
X = mu + sigma*(np.random.normal(size=n))
Xbar = np.mean(X)
lower_CI = Xbar - 1.96*sigma
upper_CI = Xbar + 1.96*sigma
lower_CIs.append(lower_CI)
upper_CIs.append(upper_CI)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。