微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用 hunspell 查找 jamspell 中的错误单词

如何解决使用 hunspell 查找 jamspell 中的错误单词

我正在使用 jamspell 库来检查拼写,对于我的用例来说似乎没问题。

https://github.com/bakwc/JamSpell

如果我理解正确,任何不属于训练语料库的词都被认为是错误的。如果我的语料库有“begt”和“cherken”,那么不会为这一行建议任何词......“我是 begt 拼写 cherken”。我说的对吗?

是否可以使用 hunspell 来确定哪些单词是错误的,然后使用 jamspell 提出建议? 如果这是不可能的,是否有任何脚本可以读取冗长的文本,根据 hunspell 字典检查它并简单地删除无效的单词?

我之所以这么问是因为我的训练语料库似乎有很多拼错的单词,我正在寻找一种方法来清理它。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。