java – Lucene索引问题带有“ – ”字符

时间：2019-04-30分类：Java作者：佚名

我遇到了一个Lucene索引,它索引了含有“ – ”字符的单词.

它适用于包含“ – ”但不是所有的一些单词,我没有找到原因,为什么它不工作.

我正在搜索的字段被分析,并且包含具有和不具有“ – ”字符的单词的版本.

我正在使用分析器：org.apache.lucene.analysis.standard.StandardAnalyzer

这里有一个例子：

如果我搜索“gsx- *”,我得到一个结果,索引的字段包含
“SUZUKI GSX-R 1000 GSX-R1000 GSXR”

但如果我搜索“v- *”,我没有结果.预期结果的索引字段包含：
“SUZUKI DL 1000 V-STROM DL1000V-STROMVSTROM V STROM”

如果我搜索“v-strom”而没有“*”它可以工作,但如果我只是搜索“v-str”,例如我没有得到结果. (应该是一个结果,因为它是一个网上商店的实时搜索)

那么2个预期结果有什么区别？为什么它适用于“gsx”,但不适用于“v-”？

解决方法

StandardAnalyzer将连字符视为空白,我相信.所以它将您的查询“gsx- *”转换为“gsx *”和“v- *”,因为也消除了单字母令牌.您在搜索结果中看到的字段内容是字段的存储值,它完全独立于为该字段编入索引的条款.

所以你想要的是“v-strom”作为一个整体来成为一个索引的术语. StandardAnalyzer不适合这种文本.也许可以与WhitespaceAnalyzer或SimpleAnalyzer一起去.如果仍然没有削减它,您也可以选择将自己的分析仪扔在一起,也可以选择将其分开,然后再进一步使用TokenFilters进行组合. the Lucene Analysis package Javadoc.提供了非常好的解释

BTW,没有必要输入索引中的所有变体,如V-strom,V-Strom等.这个想法是使同一个分析器将所有这些变体标准化为索引中的同一个字符串,同时解析查询.

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

相关推荐

IntelliJ Idea 常用快捷键列表

Alt+回车导入包,自动修正Ctrl+N 查找类Ctrl+Shift+N 查找文件Ctrlʺlt+L 格式化代码Ctrlʺlt+O 优化导入的类和包Alt+Insert 生成代码(如get,set方法,构造函数等)Ctrlʾ或者Alt+Shiftʼ 最近更改的代码Ctrl+R 替换文本Ct

HTTP Status 500

运行程序出现下面错误：HTTP Status 500 ---------------------------------------------------------------------------------type Exception reportmessagedescription Th

使用manageprofiles来建立websphere的profile

1、建立DM的profile,使用的模版在install_root/profileTemplates/dmgr下句法为：manageprofile.sh -create -templatePath install_root/profileTemplates/dmgr调用参数为：-create 建立一

dom4j java.lang.NoClassDefFoundError: org/jaxen/JaxenException

使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式，标题都写的这么阔气：Powerful Navigation with XPath。方法是使用Document的selectNodes(String XPath)方法，代码

Intellij idea 乱码问题(英文操作系统)

英文操作系统导致 Debug 下的变量查看时显示乱码，可通过改变字体解决此问题。

eclipse中js报错

eclipse中javascript报错问题处理：三个地方：<1>"eclipse设置 "：Java代码window->preference->Validator->Errors/Warnings->Enable Javascript Sema

Win7下Eclipse中文字体太小

打开eclipse中文字体很小，简直难以辨认。在网上搜索发现这是由于Eclipse 用的字体是 Consolas，显示中文的时候默认太小了。解决方式有两种：一、把字体设置为Courier New操作步骤：打开Elcipse，点击菜单栏上的“Windows”——点击“Preferences”——点击“

Redis 密码设置

如果不加密码，默认只能本机访问，加密码也是为了安全考虑 1.进入Redis 的安装目录，找到redis.conf文件。用vi命令打开文件输入 / requirepass 进行查找，输入n查找下一个。 (最好复制一个新的conf文件) 在红背景处设置密码 2.重启 Redis &

一台服务器部署多个tomcat

设置LINUX 自启动：在/etc/rc.d/rc.local中加入: conf 目录下一个文件 server.xml

ArrayList、Vector和LinkedList等的区别与用法

ArrayList 和Vector是采用数组方式存储数据，此数组元素数大于实际存储的数据以便增加和插入元素，都允许直接序号索引元素，但是插入数据要设计到数组元素移动等内存操作，所以索引数据快插入数据慢，Vector由于使用了synchronized方法（线程安全）所以性能上比ArrayList要差，

UML中的五种关系

在实现设计模式之前，首先来复习以下UML中的五种关系图依赖<关联<聚合<组合 <1>依赖依赖关系用虚线加箭头表示,如图所示: 上图表示:Animal类依赖于Water类（动物依赖于水）。依赖是类的五种关系中耦合最小的一种关系。因为依赖关系在生成代码的时候，这两个关

spring mvc 3 最简单demo

第一步：准备包：日志相关包jcl-over-slf4j-1.6.1.jarlogback-classic-0.9.29.jarlogback-core-0.9.29.jarslf4j-api-1.6.1.jarjstl包jstl-1.2.jarspring 相关包org.springframewor

Project facet Java version 1.7 is not supported

当运行这个web程序时，无法运行，提示错误如下：当时安装的tomcat是tomcat7版本，安装的jdk版本是1.6。配置的tomcat如下：window-Preferences-Server-Runtime Environment，添加tomcat。如下：检查多次，tomcat安装，环境配置

diamond operator is not supported in -source 1.5

代码中会让补全，否则会报 diamond operator is not supported in -source 1.5 需要在POM中指定 source 版本号

Error:java: invalid source release 无效的源发行版: 8

原因：这是由于jdk的版本与项目的要求不一致造成的，如果是maven项目，首先查看一下pom.xml,以我的项目为例：从其中可以看出要求的编译插件为1.8版本，而我本机上安装的jdk为1.7版本，因此需要首先下载安装1.8版本的jdk下载链接为 jdk下载链接然后在intellij idea中点

Unable to start web server; nested exception is org.springframework.context.ApplicationContextException: Unable to start ServletWebServerApplicationContext due to missing ServletWebServerFactory bean.

照着教程弄的第一个 DEMO，结果启不来。解决办法：在Controller 上面加上 @EnableAutoConfiguration 成功启动 Demo的其它内容及配置如下图，新建一个空的 Maven 项目 Pom.xml 主界面： Control.java 运行报错 :: Spri

Intellij 高亮显示与选中字符串相同的内容

如下图所示，我的是 2018，不同版本，Schema 可能要 Save As一下

Vue打包发布Tomcat、Ngins，刷新报错404解决方法

Ant Design Pro Vue 打包发布到Tomcat后，刷新报错404解决方法在应用下面加 WEB-INF 建 web.xml 内容如下 <?xml version="1.0" encoding="ISO-8859-1&qu

正则查找符合条件的数据

效果如图： JAVA 代码 public static void main(String[] args) throws Exception { String str = "<row PTID=\"80268175\" ZYH=\"2002868

org.apache.xerces.dom.ElementNSImpl.setUserData(Ljava/lang/String;Ljava/lang

HTTP Status 500 - Handler processing failed; nested exception is java.lang.AbstractMethodError: org.apache.xerces.dom.ElementNSImpl.setUserData(Ljava/

分类导航

热门文章

最新文章