微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

天赋分类模型训练中的数据是如何解析的?

如何解决天赋分类模型训练中的数据是如何解析的?

所以我准备了一个数据集来训练一个天赋分类模型。它以正确的方式格式化(label)。然而,当我去训练我的模型时,我相信它会混淆数据。这可能是因为其他分隔符,因为我的数据集充满了空格、分号、单引号和双引号以及逗号。

this is an example of one of my datasets

当我运行火车模型程序并打印语料库信息时,它给了我以下信息: corpus printed corpus information

当模型尝试训练时,每个 epoch 都有相同的问题: [W ParallelNative.cpp:206] 警告:在使用本机并行后端(函数 set_num_threads)时,在并行工作开始后或在 set_num_threads 调用后无法设置内部操作线程数

每个时期都没有改进或发展: 2021-07-26 10:26:51,694 DEV:损失 6.476138114929199 - 得分 0.0

2021-07-26 10:26:51,812 BAD EPOCHS(无改善):0

最终结果如下: results

如果有人能指出我如何使这个模型训练工作的正确方向,我将不胜感激。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。