我正在使用雪球分析仪来阻止多个文档的标题.一切都运作良好,但他们是一些怪癖.
例:
搜索“valv”,“valve”或“valve”会返回相同数量的结果.这是有道理的,因为雪球分析仪将所有内容减少到“valv”.
使用通配符时遇到问题.搜索“valve *”或“valve *”不会返回任何结果.搜索“valv *”按预期工作.
我理解为什么会这样,但我不知道如何解决它.
我想过编写一个存储词干和非词干标记的分析器.基本上应用两个分析器并组合两个令牌流.但我不确定这是否是一个实用的解决方案.
我还考虑过使用AnalyzingQueryParser,但我不知道如何将它应用于多字段查询.此外,使用AnalyzingQueryParser会在搜索“valve *”时返回“valve”的结果,这不是预期的行为.
是否有一种利用通配符和词干算法的“首选”方式?
解决方法
原文地址:https://www.jb51.cc/html/232410.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。