java – Lucene索引问题带有“ – ”字符

我遇到了一个Lucene索引,它索引了含有“ – ”字符的单词.

它适用于包含“ – ”但不是所有的一些单词,我没有找到原因,为什么它不工作.

我正在搜索的字段被分析,并且包含具有和不具有“ – ”字符的单词的版本.

我正在使用分析器:org.apache.lucene.analysis.standard.StandardAnalyzer

这里有一个例子:

如果我搜索“gsx- *”,我得到一个结果,索引的字段包含
“SUZUKI GSX-R 1000 GSX-R1000 GSXR”

但如果我搜索“v- *”,我没有结果.预期结果的索引字段包含:
“SUZUKI DL 1000 V-STROM DL1000V-STROMVSTROM V STROM”

如果我搜索“v-strom”而没有“*”它可以工作,但如果我只是搜索“v-str”,例如我没有得到结果. (应该是一个结果,因为它是一个网上商店的实时搜索)

那么2个预期结果有什么区别?为什么它适用于“gsx”,但不适用于“v-”?

解决方法

StandardAnalyzer将连字符视为空白,我相信.所以它将您的查询“gsx- *”转换为“gsx *”和“v- *”,因为也消除了单字母令牌.您在搜索结果中看到的字段内容是字段的存储值,它完全独立于为该字段编入索引的条款.

所以你想要的是“v-strom”作为一个整体来成为一个索引的术语. StandardAnalyzer不适合这种文本.也许可以与WhitespaceAnalyzer或SimpleAnalyzer一起去.如果仍然没有削减它,您也可以选择将自己的分析仪扔在一起,也可以选择将其分开,然后再进一步使用TokenFilters进行组合. the Lucene Analysis package Javadoc.提供了非常好的解释

BTW,没有必要输入索引中的所有变体,如V-strom,V-Strom等.这个想法是使同一个分析器将所有这些变体标准化为索引中的同一个字符串,同时解析查询.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Alt+回车 导入包,自动修正Ctrl+N 查找类Ctrl+Shift+N 查找文件Ctrlʺlt+L 格式化代码Ctrlʺlt+O 优化导入的类和包Alt+Insert 生成代码(如get,set方法,构造函数等)Ctrlʾ或者Alt+Shiftʼ 最近更改的代码Ctrl+R 替换文本Ct
运行程序出现下面错误:HTTP Status 500 ---------------------------------------------------------------------------------type Exception reportmessagedescription Th
1、建立DM的profile,使用的模版在install_root/profileTemplates/dmgr下句法为:manageprofile.sh -create -templatePath install_root/profileTemplates/dmgr调用参数为:-create 建立一
使用dom4j解析XML时,要快速获取某个节点的数据,使用XPath是个不错的方法,dom4j的快速手册里也建议使 用这种方式,标题都写的这么阔气:Powerful Navigation with XPath。 方法是使用Document的selectNodes(String XPath)方法,代码
英文操作系统导致 Debug 下的变量查看时显示乱码,可通过改变字体解决此问题。
eclipse中javascript报错问题处理:三个地方:<1>"eclipse设置 ":Java代码window->preference->Validator->Errors/Warnings->Enable Javascript Sema
打开eclipse中文字体很小,简直难以辨认。在网上搜索发现这是由于Eclipse 用的字体是 Consolas,显示中文的时候默认太小了。解决方式有两种:一、把字体设置为Courier New操作步骤:打开Elcipse,点击菜单栏上的“Windows”——点击“Preferences”——点击“
如果不加密码,默认只能本机访问,加密码也是为了安全考虑 1.进入Redis 的安装目录,找到redis.conf文件。用vi命令打开文件 输入 / requirepass 进行查找,输入n查找下一个。 (最好复制一个新的conf文件) 在红背景处设置密码 2.重启 Redis &
设置LINUX 自启动: 在/etc/rc.d/rc.local中加入: conf 目录下一个文件 server.xml
ArrayList 和Vector是采用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,都允许直接序号索引元素,但是插入数据要设计到数组元素移动等内存操作,所以索引数据快插入数据慢,Vector由于使用了synchronized方法(线程安全)所以性能上比ArrayList要差,
在实现设计模式之前,首先来复习以下UML中的五种关系图 依赖<关联<聚合<组合 <1>依赖 依赖关系用虚线加箭头表示,如图所示: 上图表示:Animal类依赖于Water类(动物依赖于水)。 依赖是类的五种关系中耦合最小的一种关系。因为依赖关系在生成代码的时候,这两个关
第一步:准备包:日志相关包jcl-over-slf4j-1.6.1.jarlogback-classic-0.9.29.jarlogback-core-0.9.29.jarslf4j-api-1.6.1.jarjstl包jstl-1.2.jarspring 相关包org.springframewor
当运行这个web程序时,无法运行,提示错误如下: 当时安装的tomcat是tomcat7版本,安装的jdk版本是1.6。 配置的tomcat如下:window-Preferences-Server-Runtime Environment,添加tomcat。如下: 检查多次,tomcat安装,环境配置
代码中 会让补全,否则会报 diamond operator is not supported in -source 1.5 需要在POM中指定 source 版本号
原因:这是由于jdk的版本与项目的要求不一致造成的,如果是maven项目,首先查看一下pom.xml,以我的项目为例: 从其中可以看出要求的编译插件为1.8版本,而我本机上安装的jdk为1.7版本,因此需要首先下载安装1.8版本的jdk下载链接为 jdk下载链接 然后在intellij idea中点
照着教程弄的第一个 DEMO,结果启不来。 解决办法:在Controller 上面加上 @EnableAutoConfiguration 成功启动 Demo的其它内容及配置如下图,新建一个 空的 Maven 项目 Pom.xml 主界面: Control.java 运行报错 :: Spri
如下图所示,我的是 2018,不同版本,Schema 可能要 Save As一下
Ant Design Pro Vue 打包发布到Tomcat后,刷新报错404解决方法 在应用下面加 WEB-INF 建 web.xml 内容如下 <?xml version="1.0" encoding="ISO-8859-1&qu
效果如图: JAVA 代码 public static void main(String[] args) throws Exception { String str = "<row PTID=\"80268175\" ZYH=\"2002868
HTTP Status 500 - Handler processing failed; nested exception is java.lang.AbstractMethodError: org.apache.xerces.dom.ElementNSImpl.setUserData(Ljava/