如何解决如何绘制三维甚至更高维的多元高斯分布
在机器学习和模式识别的研究中,我们知道如果样本i具有二维特征(长度,权重),则长度和权重均属于高斯分布,因此我们可以使用多元高斯分布来描述它
这只是一个3D图,如下所示:
其中z轴是可能性, 但是如果这个样本我具有三个三维特征,x1,x2,x3 .... xn甚至更大,我们该如何使用一个图正确地绘制它呢?
解决方法
您可以使用降维方法来可视化高维数据。 https://scikit-learn.org/stable/auto_examples/manifold/plot_compare_methods.html#sphx-glr-auto-examples-manifold-plot-compare-methods-py
- 将D维数据转换为2维或3维数据
- 将变换后的数据点绘制在2或3个数据点上,具体取决于数据缩减的维度。
让我们考虑一个例子。拿10维高斯
import matplotlib.pyplot as plt
import numpy as np
DIMENSION = 10
mean = np.zeros((DIMENSION,))
cov = np.eye(DIMENSION)
X = np.random.multivariate_normal(mean,cov,5000)
然后执行降维(我使用过PCA,您可以根据对特定类型数据的算法有效性的先验知识选择其他方法)
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from sklearn.decomposition import PCA
X_2d = PCA(n_components=2).fit_transform(X)
X_3d = PCA(n_components=3).fit_transform(X)
然后绘制它们
fig = plt.figure(figsize=(12,4))
ax = fig.add_subplot(121,projection='3d')
ax.scatter(X_3d[:,0],X_3d[:,1],2])
plt.title('3D')
fig.add_subplot(122)
plt.scatter(X_2d[:,X_2d[:,1])
plt.title('2D')
您也可以与其他算法一起玩。每个提供不同的优势。 我希望这能回答您的问题。
注:在更高维度中,“维度诅咒”之类的现象也开始起作用。因此可能无法在较低尺寸上进行精确投影。就像为什么格陵兰岛在地图上看起来和非洲差不多。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。