微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

想要的算法:找到类似于自由文本中的单词的字典中的所有单词

我们有一个约15万个单词的列表,当用户输入一个免费的文本时,系统应该提供字典中的单词列表,这些单词与自由文本中的单词非常接近.

例如,用户输入:“我想在沃尔玛购买legoe玩具”.如果字典包含“乐高”,“汽车”和“沃尔玛”,系统应在列表中出现“乐高”和“沃尔玛”. “沃尔玛”是显而易见的,因为它与句子中的单词是一样的,但是“乐高”与“乐高”也是一样的.然而,没有什么是类似于“汽车”,所以这个词没有显示.

显示列表应该是实时的,这意味着当用户输入句子时,单词列表必须存在于屏幕上.有人知道一个很好的算法吗?

字典实际上包含可能包含空格的概念.例如,“乐高太空飞船”.完美的解决方案也能识别这些多字概念.

任何建议是赞赏.

解决方法

看一下 http://norvig.com/spell-correct.html的简单算法.本文使用Python,但最终有其他语言的实现链接.

原文地址:https://www.jb51.cc/html/230682.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐