微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Solr 搜索相关性影响

如何解决Solr 搜索相关性影响

我有一个 MysqL 数据库,我每天都将数据同步到 solr,我的 web 应用程序经常从 solr 查询数据。我的 solr 集群中没有启用备份。如果我关闭现有集群并想创建新集群并将数据从 MysqL 填充到 solr 中,搜索结果是否与我以前从以前的集群中获得的结果相同。

自从我从去年开始查询旧集群以来,solr 是否存储了有关经常搜索的术语和文档的任何内部信息,从而提高了它的受欢迎程度? ,或者如果我只是创建新集群,搜索结果将是相同的。

解决方法

Solr 不存储任何查询历史或使用流行的搜索或结果来影响分数(这样想:Solr 提供的结果已经根据查询中给定的因素进行了评分;使用该数据来改变评分不会t 影响任何事情,因为数据已经以相同的方式呈现)。您可以使用外部信号(点击流等)通过在其他领域拥有这些数据来改变自己的评分,但这取决于您作为开发者。

关于您问题的第一部分;搜索结果将是相同的。如果两个文档的评分相同,则它们各自的顺序由它们在 Lucene 索引中的顺序决定。如果重新索引后该顺序发生变化,您可能会看到具有相同分数的文档在搜索结果中的位置发生了变化。

另一个因素是,如果您最近没有优化索引(手动或通过合并因子),如果您的索引中有许多已删除的文档,分数也可能会发生变化。计算分数时仍会考虑已删除的文档,但在优化或合并后,这些文档将从索引中删除,不再影响分数。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。