如何解决多元正态分布拟合数据集
我正在阅读一些关于 RNN 网络的论文。在某些时候,我遇到了以下解释:
在 sN 上训练的预测模型用于计算误差向量 验证和测试序列中的每个点。误差向量被建模 拟合多元高斯分布 N = N (μ,Σ)。似然 p(t) 观察误差向量 e(t) 的结果由 e(t) 处的 N 值给出(类似于 标准化创新平方 (NIS) 用于使用卡尔曼进行新颖性检测 基于滤波器的动态预测模型 [5])。点的误差向量来自 vN1 用于使用最大似然估计参数 μ 和 Σ 估计。
还有:
多元高斯分布拟合误差 验证集上的向量。是 (t) 是错误的概率 矢量 e (t) 应用多元高斯分布后 N = N (µ,±)。最大似然估计用于 为 vN 中的点选择参数 µ 和 Σ。
vN 或 vN1 是验证数据集。 sN 是训练数据集。
它们来自 2 篇不同的文章,但描述的是同一件事。我并没有真正理解将多元高斯分布拟合到数据中的含义。什么意思?
非常感谢,
纪尧姆
解决方法
让我们先从一维数据开始。如果数据分布在一维线中,则它们具有均值 (µ) 和方差 (sigma)。然后对它们进行建模就像让 (µ,sigma)
按照您的主要分布生成新数据点一样简单。
# Generating a new_point in a 1D Gaussian distribution
import random
mu,sigma = 1,1.6
new_point = random.gauss(mu,sigma)
# 2.797757476598497
现在在 N
维空间中,多元正态分布是一维的推广。总体而言,目标是找到 N
的平均值 µ
和 N x N
这次由 Σ
记录的协方差,以对 N
维空间中的所有数据点建模。有了它们,您可以按照主要分布生成任意数量的随机数据点。在 Python/Numpy 中,你可以这样做:
import numpy as np
new_data_point = np.random.multivariate_normal(mean,covariance,1)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。