如何解决中文查询导致异常高的召回率
我们遇到中文查询的意外高召回率。我设法使用仅具有2个属性的简单数据模型重现了最小的用例。
禁止复制
-
使用zh-Hans.microsoft分析器为中文产品说明定义属性DescriptionZhCn
-
使用DescriptionZhCn
中的以下值填充两个记录Contoso减振接杆
Contoso缩径接柄
-
使用以下选项进行搜索:searchMode = all,queryType = full,searchFields = DescriptionZhCn,api-version = 2019-05-06,搜索参数中包含以下值:
减振接杆
缩径接柄
预期
搜索减振接杆时,我只希望记录描述为“ Contoso减振接杆”。在搜索缩径接柄时,我只希望记录“ Contoso缩径接柄”。
实际
搜索减振接杆或缩径接柄意外地返回了两条记录。唯一的普通字符是第三个字符接。
我已经验证了zh-Hans.microsoft分析器的输出,它将两个中文字符串都分成4个标记。例如
减振接杆 => 减 振 接 杆
我的查询仅匹配标记之一。我正在使用searchMode = all。为什么我的查询匹配?这是一个错误吗?任何输入Yanoosh,Liam?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。