elasticsearch php不返​​回没有空格的搜索结果

如何解决elasticsearch php不返​​回没有空格的搜索结果

我已经在Elasticsearch索引products_idx1添加了15,000条记录,并键入了product

在记录产品名称时,例如apple iphone 6,因此当我搜索iphone6时会返回空数据。

这是我在PHP elasticsearch中的代码

<?PHP

    use Elasticsearch\ClientBuilder;

    require 'vendor/autoload.PHP';

   $client = ClientBuilder::create()->build();
 $values =['name','name.prefix','name.suffix','sku'];
$params =
[
'client'=>['verify'=>1,'connect_timeout'=>5],'from'=> 0,'size'=>25,'body'  =>[
'query' => [
 'bool'=>
            [
            'should'=> [[
                'multi_match'=> ['query'=>'iphone6','type'=>'cross_fields','fields'=>$values,'operator'=>'OR']
                ],['match'=>['all'=>['query'=>'iphone6','operator'=>'OR','fuzziness'=>'AUTO'] ]]
                ]
            ]

],'sort'=>['_score'=>['order'=>'desc']],],'index'=>'products_idx1'
];

 $response = $client->search($params);
echo "<pre>";print_r($response);

解决方法

使用shinglepattern_replace token filter,可以获取问题和评论(又名iphoneiphone6和{{1 }}和下面是它的完整示例。

如评论中所述,您从搜索字词生成的搜索时间标记应与从索引文档生成的索引时间标记匹配,以获取搜索结果,而这正是我通过创建自定义项实现的分析器。

索引映射

appleiphone

为示例文档建立索引

{
  "settings": {
    "analysis": {
      "analyzer": {
        "text_analyzer": {
          "tokenizer": "standard","filter": [
            "shingle","lowercase","space_filter"
          ]
        }
      },"filter": {
        "space_filter": {
          "type": "pattern_replace","pattern": " ","replacement": "","preserve_original": true
        }
      }
    }
  },"mappings": {
    "properties": {
      "title": {
        "type": "text","analyzer": "text_analyzer"
      }
    }
  }
}

{ "title" : "apple iphone 6" } 的搜索查询及其结果

appleiphone

结果

{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": "appleiphone"
          }
        }
      ]
    }
  }
}

搜索带有结果的"hits": [ { "_index": "ana","_type": "_doc","_id": "1","_score": 0.3439677,"_source": { "title": "apple iphone 6","title_normal": "apple iphone 6" } } ] 的查询

iphone6

结果

{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": "iphone6"
          }
        }
      ]
    }
  }
}

"hits": [ { "_index": "ana","title_normal": "apple iphone 6" } } ] 的最后但并非最不重要的搜索查询

iphone

结果

{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": "iphone"
          }
        }
      ]
    }
  }
}
,

由于我的答案已经非常大了,出于可读性的原因以及对Elasticsearch和analyze API中的分析器不太熟悉的人们,在另一个答案中添加有关how it works的信息。

在我上一个答案的评论中,@ Niraj提到了其他文档正在运行,但是他遇到iphone6查询问题,因此为了调试问题, anlyze API 非常有用。

首先检查您认为与您的搜索查询匹配的文档中存在的索引时间标记,在这种情况下为apple iphone 6

PUT http:// {{hostname}}:{{port}} / {{index}} / _analyze

{
"text" : "apple iphone 6","analyzer" : "text_analyzer"
}

并生成令牌

{
"tokens": [
{
"token": "apple","start_offset": 0,"end_offset": 5,"type": "<ALPHANUM>","position": 0
},{
"token": "appleiphone","end_offset": 12,"type": "shingle","position": 0,"positionLength": 2
},{
"token": "iphone","start_offset": 6,"position": 1
},{
"token": "iphone6",//note this carefully
"start_offset": 6,"end_offset": 14,"position": 1,{
"token": "6","start_offset": 13,"type": "<NUM>","position": 2
}
]
}

现在您可以看到我们使用的分析仪也创建了iphone6作为令牌,现在检查搜索时间令牌

{
  "text" : "iphone6","analyzer" : "text_analyzer"
}

和令牌

{
    "tokens": [
        {
            "token": "iphone6","end_offset": 7,"position": 0
        }
    ]
}

现在您可以注意到搜索令牌还创建了iphone6作为令牌,该令牌也出现在索引时间令牌中,因此这就是它与我在完整示例中已经显示的搜索查询相匹配的原因在第一个答案中给出

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?