如何解决我可以使用主成分分析将我的数据减少到一个维度吗?
我有一个包含 10 个变量的数据集,我希望将其减少到一个“分数”。我了解 PCA 的基础知识,它使用变量的协方差矩阵来创建 10 个特征向量和 10 个特征值。通常所做的是人们将特征向量乘以归一化数据以生成主成分,他们选择任意数量的主成分,并将它们投入回归并获得拟合值。换句话说,系数乘以主成分允许将数据简化为单个变量。
我的问题是我是否需要进行回归步骤(我没有因变量)。我可以使用特征值作为我的系数,而不是进行回归?换句话说,我可以取特征值向量和主成分的内积来创建单个变量吗?
我从未见过以这种方式使用它(据我所知甚至没有人问过这个问题),但对我来说似乎很直观。我是否遗漏了什么或者这是合法的,我只是没有找对地方?谢谢!
解决方法
你有目标变量吗? 因为这里有两件事,
如果你有一个目标变量(一个你想要预测或解释的变量),如果不是第二个,那么回归。 PC 回归 --> 你需要一个目标变量
PC 分析 --> 您不需要任何回归步骤。
我认为您属于第二种情况。所以你只是想把你的 10 个变量减少到 1 个总结一切。
也许有趣的 Python 教程:https://jakevdp.github.io/PythonDataScienceHandbook/05.09-principal-component-analysis.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。