微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

关于重尾分布的基本问题

如何解决关于重尾分布的基本问题

我有一个关于重尾分布的基本问题。

假设西班牙有 50,000 个城市,每个城市的人口由 p(1),p(2),...,p(n) 表示。根据分布的均值 ? 和偏差 ?,我们如何判断该分布是否为重尾分布?我们应该考虑什么程序?

解决方法

如果您拥有全部 50,000 个观测值,那么您可以计算关于均值的中心矩。

特别是,第四个中心矩除以方差的平方就是峰态。这个数字会告诉你分布是否是 platykurtic。如果大于 3,则表示您的分布比标准正态分布的尾部更重。

因此,如果您使用 Python 并且所有 50K 观察值都存储在 x 中:

from scipy import stats

# Calculate kurtosis
k = stats.moment(x,4) / x.var()**2

# Evaluate
if k > 3:
    print('Distribution has heavy tails')
else:
    print('Distribution does not have heavy tails')

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。