如何解决自定义搜索 ngram 索引项
我正在使用 ngram 标记器进行索引(min_ngram 为 1,max_ngram 为 5)。这工作正常,但无论我使用哪个 search_analyzer,搜索该索引都会产生不好的结果。
- 关键字搜索分析器不会定位大于 5 的任何字词。
- ngram 搜索分析器返回错误命中,因为如果我输入“CranBerry”之类的内容,我最终会得到大量多余的“C”、“r”、“be”、“y”、等等。
- 标准搜索分析器与关键字搜索分析器存在相同的问题。
我想要实现的是拥有类似 ngram 搜索分析器的东西,其中相邻的点击被合并,更长的点击被提升到顶部。因此,例如,如果我要搜索“CranBerry”,则查找将是“Cranb”、“ranbe”、“anber”等。具有更多相邻命中的结果(例如,在索引 0 处找到“Cranb”、“ranbe” " 在索引 1 处找到,在索引 2 处找到“anber”,...) / 匹配“CranBerry”的整体将被提升到顶部。
标准开源 elasticsearch 7.12 中是否有类似的东西?如果没有,API 是否支持添加这样的功能?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。