微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何对未标记的测试数据进行文本分类?

如何解决如何对未标记的测试数据进行文本分类?

我正在使用 TF-IDF 执行特征提取,然后传递稀疏矩阵以与文本数据一起执行训练,文本数据也转换为稀疏矩阵。我知道用于训练和测试的分类器的输入需要文本和标签。 由于训练和测试数据集都被标记,这是执行分类以稍后使用统计度量检查模型有多好的常用方法

但是如果我们想对未标记的测试数据进行分类,我们如何以同样的方式进行分类?例如,应用 TF-IDF,然后使用分类器。

请提供任何指导。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。