如何解决PostgreSQL文本搜索性能
我一直在研究具有以下格式的varchar字段(大约10到400个字符)的文本搜索(没有tsvector):
field,field_a,field_b,field_c,...,field_n
我计划运行的查询可能类似于:
select * from information_table where fields like '%field_x%'
由于字段中没有空格,我想知道如果我对500k +行进行搜索是否存在一些性能问题。 有什么见解吗? 关于varchar性能以及varchar索引的任何文档吗?
我不确定tsvector是否可以在没有空格的完整字符串上运行。您如何看待该解决方案?您是否看到其他有助于提高性能的解决方案?
谢谢,我希望收到您的来信。 R
解决方法
通常,文本搜索解析器将逗号和空格视为相同,因此,如果要使用FTS,带有逗号的结构不会造成问题。 pg_trgm也将逗号和空格视为相同,因此,如果您想使用该方法,由于逗号也不会出现问题。
性能将取决于查询中的令牌在文本正文中的流行或稀有程度。很难基于一个示例行和一个示例查询来概括一下,这两者看起来都不是很现实。解决这个问题的最佳方法是在EXPLAIN (ANALYZE,BUFFERS)
且启用track_io_timing的情况下,使用真实(或至少真实)数据运行一些真实查询。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。