Python计算置信区间

如何解决Python计算置信区间

我正在尝试使用以下脚本计算 10,000 个上限和下限置信区间：

import numpy as np
import statistics as stat
from matplotlib import pyplot as plt

N = 10000
sigma = 1
mu = 10
n = 10

X = []
for i in range (N):
    X.append(mu + sigma*(np.random.normal(size=n)))
    Xbar = np.mean(X,axis=0)
    lower_CI = Xbar - 1.96*sigma/np.sqrt(n)
    upper_CI = Xbar + 1.96*sigma/np.sqrt(n)

计算间隔后，我需要找到包含 mu = 10 的间隔分数。但是，我只得到 10 个上限和下限间隔，而不是 10,000。此外，Xbar 有 10 个值。为什么它不是只有一个值，因为它是 X 的平均值？

我哪里出错了？

解决方法

首先，您发布的代码中发生了以下情况： mu + sigma*(np.random.normal(size=n)) 为您提供具有 mu 和 sigma 的正态分布的 n=10 样本数组。 X.append(mu + sigma*(np.random.normal(size=n))) 将此添加到您的 X 列表中，以便 X 成为数组列表。 Xbar = np.mean(X,axis=0) 轴 = 0，您告诉 numpy 计算沿数组列表的轴 0 的平均值。这意味着计算数组 X 列表中数组的每个索引的平均值，这就是 Xbar 有 10 个条目的原因。 lower_CI = Xbar - 1.96*sigma/np.sqrt(n) 在这里，您将 lower_CI 设置为 Xbar 减去一些基于 sigma 的数字作为您的置信区间。因为 Xbar 有 10 个条目，所以结果也将有 10 个条目。但是，因为您在 for 循环的每次迭代中都覆盖了 lower_CI，而不是将值存储在列表中，所以您不会得到 10,000 个下限。

我不完全确定您到底要做什么，但以下代码将估计 mu 和 sigma 的置信下限和上限 10,000 次。

lower_CIs = []
upper_CIs = []
for i in range (N):
    X = mu + sigma*(np.random.normal(size=n))
    Xbar = np.mean(X)
    lower_CI = Xbar - 1.96*sigma
    upper_CI = Xbar + 1.96*sigma
    lower_CIs.append(lower_CI)
    upper_CIs.append(upper_CI)