微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

elasticsearch中同义词的变格

如何解决elasticsearch中同义词的变格

我使用elasticsearch 作为波兰语的搜索引擎。我使用“polish_stem”过滤器来处理像“słowo”=>“słowa”这样的标记变格,它工作正常,但我也想使用同义词列表。假设“słowo”的同义词是“wyraz”,我可以通过以下短语找到我的索引“słowo”:“słowo”(原始)、“słowa”(变格)、“wyraz”(同义词)但不是“wyrazu”(同义词的变格)。我可以做些什么来支持同义词的变格,或者我需要提供同义词列表中单词的所有变体,例如 słowo,wyraz,wyrazu,wyrazy,wyrazie...

以下是我的索引的示例配置。

{
  "settings": {
    "analysis": {
      "filter": {
        "pl_synonym" : {
            "type" : "synonym","synonyms" : [
                "słowo,wyraz"
            ]
        }
      },"analyzer": {
        "lang_pl": { 
          "type": "custom","tokenizer": "whitespace","filter": [
            "lowercase","pl_synonym","polish_stem"
          ]
        }
      }
    }
  },"mappings": {
    "properties": {
      "tags": {
        "type": "text","analyzer": "lang_pl"
      }
    }
  }
}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。