1.概述
这是三部分实用BM25系列中关于相似度排名(相关性)的第一个帖子。下一篇文章链接在底部。
背景
在Elasticsearch 5.0中,我们将Okapi BM25作为默认的相似度算法,这是用于对与查询相关的结果进行评分的算法。我不会在这篇博客中过多地介绍BM25与其他方法的对比,但如果你想了解BM25的理论论证,你可以跳转到Elastic{on} 2016的BM25解神秘化演示。相反,我将为您介绍BM25的实际用法,包括可用的参数和影响评分的因素。
请记住,这个博客主要是为文本文档评分的。也就是说,它真正专注于帮助我们的搜索用户。如果您正在为日志或指标建立索引,并返回按某个明确的元数据/数字顺序(如时间戳)排序的结果,那么这个博客主要是为了满足您的好奇心。
理解sh
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。