微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

scipy.stats:高斯核密度估计器中的带宽因子

如何解决scipy.stats:高斯核密度估计器中的带宽因子

生成一个二维高斯分布(不相关的数据)

dist2=np.array([np.random.normal(loc=10,scale=3,size=50000),np.random.normal(loc=5,scale=2,size=50000)])

我计算了协方差矩阵除以带宽因子,因为协方差属性数据集的协方差矩阵,由计算的带宽(kde.factor)缩放https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.gaussian_kde.html

from scipy.stats import kde
# Use a kernel density estimator to produce local-counts in this space,and grid them to plot.
k = kde.gaussian_kde(dist2)
k.covariance/k.factor

对角线元素不是预期的 sigma 的平方。

我认为在这个带宽因素上我有一些不明白的地方。

任何解释将不胜感激。感谢您的帮助。

解决方法

scipy.stats.kde.gaussian_kde 中实现了协方差因子,因此 k.covariance / k.factor**2 是 ~ 到 np.cov(dist2)

点击此处了解详情Getting bandwidth used by SciPy's gaussian_kde function

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。