微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

解释 pdf 的 y 值

如何解决解释 pdf 的 y 值

为了理解正态分布图的 y 值,我使用了以下代码

%reset -f

import numpy as np
from scipy.stats import norm
import matplotlib.pyplot as plt

data = [10,10,20,40,50,60,70,80,90,100]

# Fit a normal distribution to the data:
mu,std = norm.fit(data)

# Plot the histogram.
plt.hist(data,bins=10,density=True,alpha=0.6,color='g')

# Plot the PDF.
xmin,xmax = plt.xlim()
x = np.linspace(xmin,xmax,100)
p = norm.pdf(x,mu,std)
plt.plot(x,p,'k',linewidth=2)
title = "Fit results: mu = %.2f,std = %.2f" % (mu,std)
plt.title(title)

plt.show()

生成此图:

enter image description here

数据是一组人的年龄:[10,100]

如何解释生成的pdf图的y值?例如,应该如何解释 play 约等于 0.027 的小节?

我读过各种帖子,例如:

https://stats.stackexchange.com/questions/332984/interpreting-a-pdf-plot

但找不到详细解释绘图 y 轴值的信息。

0.027 是年龄在 0 到大约 20 岁范围内的概率吗?

解决方法

两个年龄x_0和x_1之间的pdf曲线下面积表示从X采样的一个点属于区间[x_0,x_1]的概率P(x_0

对于直方图,每个条形代表一个区间,条形的高度等于属于该区间的样本数,归一化使得直方图的 bin 总面积等于 1。与 pdf 类似曲线,bin 的面积给出了随机样本属于 bin 定义的区间的概率的估计。

如果正态分布确实是对您的随机变量建模的不错选择,那么当您向数据集添加点时,直方图和拟合的 pdf 会越来越接近(对于精心选择的 bin 数量)。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。