微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用 Python 中的 Scipy 从分层集群中推断集群解决方案的准确性?

如何解决如何使用 Python 中的 Scipy 从分层集群中推断集群解决方案的准确性?

我正在使用 iris 数据集在 python 中使用 scipy 构建分层集群。以下是我的代码

from sklearn import datasets
iris = datasets.load_iris()
X = iris.data
Z = linkage(X,'complete')
plt.figure(figsize=(25,10))
dendrogram(Z)
plt.show()
kclusters = fcluster(Z,3,criterion='maxclust')

如您所见,我正在尝试检索具有 3 个集群 (k=3) 的集群解决方案。执行此操作后,我会得到一个数组,该数组指定每个实例所在的集群。但是,我怎么知道哪个集群拥有大多数“Versicolor”或“Setosa”或“Virginica”实例。我如何才能实际获得三个集群中任何一个的准确性或纯度,或者进行任何类型的推论。从 kclusters 开始,我只是对三个集群中的实例分布有一个粗略的了解,仅此而已。我如何知道这种聚类方法是否适用于虹膜数据集?如果可能,请帮助我。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。