如何解决elasticsearch中同义词的变格
我使用elasticsearch 作为波兰语的搜索引擎。我使用“polish_stem”过滤器来处理像“słowo”=>“słowa”这样的标记变格,它工作正常,但我也想使用同义词列表。假设“słowo”的同义词是“wyraz”,我可以通过以下短语找到我的索引“słowo”:“słowo”(原始)、“słowa”(变格)、“wyraz”(同义词)但不是“wyrazu”(同义词的变格)。我可以做些什么来支持同义词的变格,或者我需要提供同义词列表中单词的所有变体,例如
słowo,wyraz,wyrazu,wyrazy,wyrazie...
以下是我的索引的示例配置。
{
"settings": {
"analysis": {
"filter": {
"pl_synonym" : {
"type" : "synonym","synonyms" : [
"słowo,wyraz"
]
}
},"analyzer": {
"lang_pl": {
"type": "custom","tokenizer": "whitespace","filter": [
"lowercase","pl_synonym","polish_stem"
]
}
}
}
},"mappings": {
"properties": {
"tags": {
"type": "text","analyzer": "lang_pl"
}
}
}
}
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。