使用 factoextra 包从差异度量中可视化 PAM 集群

如何解决使用 factoextra 包从差异度量中可视化 PAM 集群

此问题最初发布于 Cross Validated，但由于“题外”而关闭。从那以后，我遇到了同样的问题，想知道如何以编程方式解决它。

使用 R 的 factoextra 包，我希望使用 fviz_cluster() 函数可视化一些聚类分析；具体来说，我在执行 PAM（即 cluster::pam）后遇到了问题。

注意：所使用的数据包含所有没有缺失值的数字特征，并且在聚类之前已经过缩放和居中。

我目前的流程如下：

library(cluster)
library(factoextra)

data -> df
factoextra::get_dist(df,method = "spearman") -> dist_mtx

cluster::pam(
    x = dist_mtx,#dissimilarity matrix
    k = 4,#number of clusters
    diss = TRUE,#flag indicating use of disimiliarity matrix
    # metric = "euclidean",#ignored since dissimiliarty matrix is used
    pamonce = FALSE #default for original algo
    ) -> 
    pam_res

PAM 方法可能需要一段时间，具体取决于数据集的大小，但输出为

代表聚类的“pam”类对象。详情见?pam.object

这是我遇到问题的地方，因为 fviz_cluster 的后端代码。如果我执行以下操作：

fviz_cluster(
    object = pam_res,# data = df,geom = "point"
    )

我收到一条错误消息：

Error in array(x,c(length(x),1L),if (!is.null(names))) list(names(x),: 'data' must be of vector type,was NULL

文档指出 data 参数仅在可视化 kmeans 或 DBSCAN 时必需。即使数据包含在 fviz_cluster 函数中，上述代码块仍然不起作用。

此 SO 响应中提供了一种解决方法，并将实际数据附加到生成的“pam”对象（即 df -> pam_res$data）。虽然这有效，但我想知道它是否真的影响了结果可视化？ fviz_cluster 函数似乎不能同时使用相异矩阵 AND 数据集来生成图像，所以当我将数据添加到对象时，我的相异矩阵会被忽略吗？

任何想法将不胜感激！

干杯

使用 factoextra 包从差异度量中可视化 PAM 集群

如何解决使用 factoextra 包从差异度量中可视化 PAM 集群

相关推荐