如何解决根据样本质心之间的距离对样本进行聚类
我有将其标记为两个聚类的数据(例如:阳性,阴性)。我将获得新的样本数据,并基于距两个聚类的质心的最短距离,我要将新样本分类为正值或负值。对于那些我可以找到KMeans的例子。我的正样本数据看起来像这样
x1 = np.array([ 0.170755,...... 0.313704,0.10206 ]) # 56 dimensions
x2 = np.array([-0.371852,...... 0.255809,0.475981])
.... x28
现在,我正在尝试使用上述链接中提到的示例计算群集的质心。
X = np.array(list(zip(x,x2,x3,...,x28))).reshape(len(x1),28)
kmeans_model = KMeans(n_clusters=1).fit(X)
据我所知,该数据属于一个簇,我给出了n_clusters = 1的值,但是当我尝试打印质心kmeans_model.cluster_centers_
的值时,它给出了像[[0.02490224,0.12898346]]
这样的数组,但是我期望数组的尺寸与x1相同。我是在正确计算质心还是我的基本理解出错了?
在这种情况下,将如何计算该质心与新样本之间的距离(类似于x1)?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。