微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

php-PostgreSQL全文单词搜索问题,包含单引号

我需要使用全文本搜索获取包含“ O’henry”一词的行

我的代码

$word = "O'henry";
$sql = "SELECT * FROM mytable WHERE to_tsvector('english', col) @@ to_tsquery(:word) ";

$sth = $db->prepare( $sql );
$sth->execute(
    array(":word"=>$word)
);

我有两个问题:

1)此查询匹配包含单词O’henry的列,但也匹配包含例如“ O是的,thierry henry是个好运动员”的列.

2)如果$word以引号开头,例如’henry,我得到一个错误:tsquery:“’henry”中的语法错误,尽管搜索字符串已经被转义了.

我怎么解决这个问题?

解决方法:

认的英语词典将标记您的数据,将’视为空格.您可以使用ts_debug来检查Postgresql / tsearch如何处理您的文本:

psql=# SELECT * FROM ts_debug('english','o''henry');
   alias   |   description   | token |  dictionaries  |  dictionary  | lexemes 
-----------+-----------------+-------+----------------+--------------+---------
 asciiword | Word, all ASCII | o     | {english_stem} | english_stem | {o}
 blank     | Space symbols   | '     | {}             |              | 
 asciiword | Word, all ASCII | henry | {english_stem} | english_stem | {henri}
(3 rows)

从此输出中可以清楚地看出,如果您想让Postgres将o’henry当作一个单词,您将要么必须:

>创建一个自定义词典来处理带有撇号的单词
>或在使用前从tsvector和tsquery中去除撇号.

我想说第二种选择是迄今为止最简单的:

$sql = "SELECT * FROM mytable WHERE plainto_tsvector('english', replace(col, '''','')) @@ to_tsquery(replace(:word,'''',''));"

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐