我的代码:
$word = "O'henry";
$sql = "SELECT * FROM mytable WHERE to_tsvector('english', col) @@ to_tsquery(:word) ";
$sth = $db->prepare( $sql );
$sth->execute(
array(":word"=>$word)
);
我有两个问题:
1)此查询匹配包含单词O’henry的列,但也匹配包含例如“ O是的,thierry henry是个好运动员”的列.
2)如果$word以引号开头,例如’henry,我得到一个错误:tsquery:“’henry”中的语法错误,尽管搜索字符串已经被转义了.
我怎么解决这个问题?
解决方法:
默认的英语词典将标记您的数据,将’视为空格.您可以使用ts_debug来检查Postgresql / tsearch如何处理您的文本:
psql=# SELECT * FROM ts_debug('english','o''henry');
alias | description | token | dictionaries | dictionary | lexemes
-----------+-----------------+-------+----------------+--------------+---------
asciiword | Word, all ASCII | o | {english_stem} | english_stem | {o}
blank | Space symbols | ' | {} | |
asciiword | Word, all ASCII | henry | {english_stem} | english_stem | {henri}
(3 rows)
从此输出中可以清楚地看出,如果您想让Postgres将o’henry当作一个单词,您将要么必须:
>创建一个自定义词典来处理带有撇号的单词
>或在使用前从tsvector和tsquery中去除撇号.
我想说第二种选择是迄今为止最简单的:
$sql = "SELECT * FROM mytable WHERE plainto_tsvector('english', replace(col, '''','')) @@ to_tsquery(replace(:word,'''',''));"
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。