我有一个数组列类型的表:
title tags "ridealong";"{comedy,other}" "ridealong";"{comedy,tragedy}" "freddyjason";"{horror,silliness}"
我想编写一个查询,每个标题生成一个数组(理想情况下,它将是一个set / deduplicated数组)
例如
select array_cat(tags),title from my_test group by title
"ridealong";"{comedy,other,silliness}"
任何帮助或指示将非常感谢
(我正在使用Postgres 9.1)
基于Craig的帮助,我最终得到了以下内容(自9.1以来,语法略有改变,完全按照他的说法抱怨查询)
SELECT t1.title,array_agg(disTINCT tag.tag) FROM my_test t1,(select unnest(tags) as tag,title from my_test) as tag where tag.title=t1.title GROUP BY t1.title;
解决方法
自定义聚合
方法1:定义自定义聚合. Here’s one I wrote earlier.
CREATE TABLE my_test(title text,tags text[]); INSERT INTO my_test(title,tags) VALUES ('ridealong','{comedy,other}'),('ridealong',tragedy}'),('freddyjason','{horror,silliness}'); CREATE AGGREGATE array_cat_agg(anyarray) ( SFUNC=array_cat,STYPE=anyarray ); select title,array_cat_agg(tags) from my_test group by title;
…或者由于您不想保留订单并希望进行重复数据删除,您可以使用LAteraL查询,例如:
SELECT title,array_agg(disTINCT tag ORDER BY tag) FROM my_test,unnest(tags) tag GROUP BY title;
在这种情况下,您不需要自定义聚合.由于重复数据删除,这对于大数据集来说可能要慢得多.但是,如果不需要,删除ORDER BY可能会有所帮助.
原文地址:https://www.jb51.cc/mssql/84380.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。