如何解决不了解集群,kmeans之间的重叠
集群中为什么有重叠?是否因为sklearn.KMeans过早完成迭代?图:kmeans cluster sepal iris flower
一些澄清:
- 数据是4D的,值是标准化的(@OmG指出了我的问题的答案)
- 我在这里上传了3个文件:github repository
- code.py - minimum for this question
- code_notebook.ipynb same as code.py + other functions
- iris-dataset.csv : the dataset
因为我正在处理的示例始终只绘制前两列,所以我认为我仅在这两个变量上运行聚类。感谢您指出问题的答案!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。