如何解决如何比较不同的降维技术进行文本分析?
我正在使用大型文本数据库。我有一句话,有几个特点,我正在努力减少它。
我正在测试PCA,t-SNE和Isomap等不同尺寸的异径管。但是,我还没有找到一种方法来比较这些减少量并确定什么是对我的数据最好的技术。
我正在尝试使用R的dimRed软件包,但不适用于非常大的数据库。
library(dimRed)
library(tm)
dtm <- DocumentTermMatrix(corpus)
data_emb<- lapply(c("PCA","Isomap","tSNE"),function(x)
embed(dtm,x))
plot_R_NX(data_emb)
请,有人可以告诉我一些替代或特定的指标,以比较不同的降维算法吗?如果可能的话,我想在R或python中看到一个例子。
谢谢!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。