微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Python计算置信区间

如何解决Python计算置信区间

我正在尝试使用以下脚本计算 10,000 个上限和下限置信区间:

import numpy as np
import statistics as stat
from matplotlib import pyplot as plt

N = 10000
sigma = 1
mu = 10
n = 10

X = []
for i in range (N):
    X.append(mu + sigma*(np.random.normal(size=n)))
    Xbar = np.mean(X,axis=0)
    lower_CI = Xbar - 1.96*sigma/np.sqrt(n)
    upper_CI = Xbar + 1.96*sigma/np.sqrt(n)

计算间隔后,我需要找到包含 mu = 10 的间隔分数。但是,我只得到 10 个上限和下限间隔,而不是 10,000。此外,Xbar 有 10 个值。为什么它不是只有一个值,因为它是 X 的平均值?

我哪里出错了?

解决方法

首先,您发布的代码中发生了以下情况: mu + sigma*(np.random.normal(size=n)) 为您提供具有 mu 和 sigma 的正态分布的 n=10 样本数组。 X.append(mu + sigma*(np.random.normal(size=n))) 将此添加到您的 X 列表中,以便 X 成为数组列表。 Xbar = np.mean(X,axis=0) 轴 = 0,您告诉 numpy 计算沿数组列表的轴 0 的平均值。这意味着计算数组 X 列表中数组的每个索引的平均值,这就是 Xbar 有 10 个条目的原因。 lower_CI = Xbar - 1.96*sigma/np.sqrt(n) 在这里,您将 lower_CI 设置为 Xbar 减去一些基于 sigma 的数字作为您的置信区间。因为 Xbar 有 10 个条目,所以结果也将有 10 个条目。但是,因为您在 for 循环的每次迭代中都覆盖了 lower_CI,而不是将值存储在列表中,所以您不会得到 10,000 个下限。

我不完全确定您到底要做什么,但以下代码将估计 mu 和 sigma 的置信下限和上限 10,000 次。

lower_CIs = []
upper_CIs = []
for i in range (N):
    X = mu + sigma*(np.random.normal(size=n))
    Xbar = np.mean(X)
    lower_CI = Xbar - 1.96*sigma
    upper_CI = Xbar + 1.96*sigma
    lower_CIs.append(lower_CI)
    upper_CIs.append(upper_CI)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。