微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

weka中的一元类文本分类?

我有一个针对特定类别的训练数据集(文本)(比如癌症).我想在weka中为这个类训练一个SVM分类器.但是,当我尝试通过创建一个文件夹’癌症’并将所有这些培训文件放到该文件夹​​时,当我运行代码时,我得到以下错误
weka.classifiers.functions.SMO:无法处理一元类

我想要做的是,如果分类器找到一个与“癌症”相关的文档,它会正确地说出类名,一旦我输入了非癌症文件,就应该说“未知”.

我该怎么做才能得到这种行为?

解决方法

Weka中的SMO算法仅在两个类之间进行二进制分类. Sequential Minimal Optimization是一种用于求解SVM的特定算法,在Weka中这是该算法的基本实现.如果你有一些癌症的例子和一些不是癌症的例子,那么这将是二元的,也许你没有正确地标记它们.

但是,如果您使用的训练数据都是癌症的例子,并且您希望它告诉您未来的示例是否符合该模式,那么您正在尝试进行一类SVM,即异常值检测.

LibSVM in Weka可以处理一流的svm.与Weka SMO实现不同,LibSVM一个独立的程序,它已经与Weka连接并包含许多不同的SVM变体. Wekalist上的This post解释了如何在Weka中使用LibSVM.

原文地址:https://www.jb51.cc/html/227937.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐