如何解决R:是否可以使用数据帧格式的质心进行分类
科学出版物发表了胰腺癌分类器,我想在自己的表达集上使用该分类器。他们提供的唯一信息是带有质心的数据框(行:基因x列:子类型)(https://doi.org/10.1053/j.gastro.2018.08.033,补充表2)。到目前为止,我还没有想过要重现这种分类模型以进行预测。
我找到的所有软件包,它们从表达式数据和标签计算质心,并输出模型以预测新的集合。不幸的是,标签未随本文发布。重新计算质心是不可能的。
解决方法
您只能将k最近邻与质心一起使用。只需将质心用作训练数据,k =质心数。由于您没有提供任何数据,因此我将举一个使用虹膜数据的示例。具体质心在这里无关紧要,但是它们必须位于与您要分类的数据具有相同格式的数据框中。您可以根据需要调用类。我只叫它们A,B和C。
## Define some centroids
Centroids = aggregate(iris[,1:4],list(iris$Species),mean)[,-1]
library(class)
knn(train=Centroids,test = iris[,k=3,cl=c("A","B","C"))
[1] B A A B C B C B C A B C C A A B C B C B A B C B C B B B B C B B C B A A A
[38] A B B B B B A A B B C A A A B C C B A C B C C C B A B B C C A B A B B C C
[75] A A C C B C C A B C C C B B C A C A C A B A A A B B A C C A C B B B C B A
[112] A B C B A C A B B A B B C B B C A A B A A B A C A B C B B A B C C A B A C
[149] B C
Levels: A B C
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。