自定义搜索 ngram 索引项

如何解决自定义搜索 ngram 索引项

我正在使用 ngram 标记器进行索引(min_ngram 为 1,max_ngram 为 5)。这工作正常,但无论我使用哪个 search_analyzer,搜索该索引都会产生不好的结果。

  • 关键字搜索分析器不会定位大于 5 的任何字词。
  • ngram 搜索分析器返回错误命中,因为如果我输入“CranBerry”之类的内容,我最终会得到大量多余的“C”、“r”、“be”、“y”、等等。
  • 标准搜索分析器与关键字搜索分析器存在相同的问题。

我想要实现的是拥有类似 ngram 搜索分析器的东西,其中相邻的点击被合并,更长的点击被提升到顶部。因此,例如,如果我要搜索“CranBerry”,则查找将是“Cranb”、“ranbe”、“anber”等。具有更多相邻命中的结果(例如,在索引 0 处找到“Cranb”、“ranbe” " 在索引 1 处找到,在索引 2 处找到“anber”,...) / 匹配“CranBerry”的整体将被提升到顶部。

标准开源 elasticsearch 7.12 中是否有类似的东西?如果没有,API 是否支持添加这样的功能

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?