如何解决在python sklearn,混淆矩阵中量化每个标签的模型预测得分
首先,我要说我不是一名程序员,并且我对Python和ML的了解很少,因为我正试图学习了解大学项目的新研究方法,请理解我缺乏AI /编程知识。
我用sklearn(和linearSVM:linearSVC)训练了一个模型。输入数据是文本数据(X),我已对其进行了完全清洗并带有7个标签(y)。之后,我评估了模型并创建了混淆矩阵。
目标是了解我的模型如何(很好)对训练后的数据集中不存在的新引入的样本进行响应。我已经知道新引入的数据样本/实例带有的真实标签,因此我将其引入了模型并让其预测了标签。在引入之前,进行与训练后的数据集相同的数据/文本清理步骤。 对新引入的数据的预测有效,因此我正在深入研究输出。
我的问题是: 有没有一种简单的方法可以量化/查看模型如何评估不在训练数据集中的单个引入样本的标签分数(以及它选择了哪个,而没有选择)?尽管出现此错误,我还是尝试为此实例使用另一个混淆矩阵:
"Found input variables with inconsistent numbers of samples: [908,1]"
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。