微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用 PCA 挑选最喜欢的项目

如何解决如何使用 PCA 挑选最喜欢的项目

我运行了 PCA 组件分析:

df <- tibble(green=c(1,5,6,4,3),blue=c(3,2,3,6),dark =c(1,1,3))
df.pca <- prcomp(as.matrix(df))
summary(df.pca)

Result

现在我需要从三项中找出看起来最相似的两项。我知道前两个 PCA 解释了 95% 的差异 - 当我查看表格时,我可以推断出最相似的是蓝色和黑色。但是有没有系统的方法来做到这一点?

解决方法

PCA 经常被目视检查,以找出哪些样本彼此密切相关。

您可以绘制一个图来查看深色和蓝色更相似:

library(tidyverse)
df <- tibble(green=c(1,5,6,4,3),blue=c(3,2,3,6),dark =c(1,1,3))
df.pca <- prcomp(as.matrix(df))

plot_pca <- as.data.frame(df.pca$rotation) %>% 
  rownames_to_column(var = "sample")
ggplot(plot_pca,aes(x=PC1,y=PC2)) +
  geom_point(aes(color=sample))

(抱歉,我没有费心调整颜色以匹配您的“样本”)。

enter image description here

由 reprex 包 (v0.3.0) 于 2021 年 4 月 13 日创建

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。