如何解决评估R中的聚类结果
我使用nmf
包进行了迭代聚类。
详细地说,我每次使用500次随机观察(从〜15000次观察中采样)和78个固定变量(将nmf
参数固定为2)运行rank
函数100次。
然后我根据H <- coef(result)
矩阵中的较大值将每个变量分配给两个群集之一。
现在我有一个78 x 100
矩阵,在其中存储了组分配的结果。
问题是,如何评估/区分类似后续情况(聚类相同但符号不同):
V1 V2
1 k1 k2
2 k2 k1
3 k2 k1
4 k1 k2
5 k1 k2
由此(相同的聚类和相同的符号):
V1 V3
1 k1 k1
2 k2 k2
3 k2 k2
4 k1 k1
5 k1 k1
并且由此(群集有所不同):
V1 V4
1 k1 k1
2 k2 k1
3 k2 k2
4 k1 k1
5 k1 k2
我无法控制表示法。 换句话说,我想评估同一变量聚在一起的频率。
谢谢
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。