微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

PostgreSQL unnest()与元素编号

我有一个具有分隔值的列时,我可以使用unnest()函数
myTable
id | elements
---+------------
1  |ab,cd,efg,hi
2  |jk,lm,no,pq
3  |rstuv,wxyz

select id,unnest(string_to_array(elements,',')) AS elem
from myTable

id | elem
---+-----
1  | ab
1  | cd
1  | efg
1  | hi
2  | jk
...

如何包含元素编号?也就是说:

id | elem | nr
---+------+---
1  | ab   | 1
1  | cd   | 2
1  | efg  | 3
1  | hi   | 4
2  | jk   | 1
...

我想要源字符串中每个元素的原始位置。我试过与窗口函数(row_number(),rank()等),但我总是得到1.也许是因为他们在源表的同一行?

我知道这是一个坏的表设计。这不是我的,我只是试图解决它。

Postgres 9.4或更高版本

使用WITH ORDINALITY设置返回功能

When a function in the FROM clause is suffixed by WITH ORDINALITY,a
bigint column is appended to the output which starts from 1 and
increments by 1 for each row of the function’s output. This is most
useful in the case of set returning functions such as UNnesT().

结合LATERAL feature in pg 9.3+,并根据这个thread on pgsql-hackers,上面的查询现在可以写成:

SELECT t.id,a.elem,a.nr
FROM   tbl AS t
LEFT   JOIN LAteraL unnest(string_to_array(t.elements,'))
                    WITH ORDINALITY AS a(elem,nr) ON TRUE;

LEFT JOIN … ON TRUE保留左表中的所有行,即使右表的表达式没有返回任何行。如果这是没有关系,你可以使用这个另外等价,更简洁的形式与隐式CROSS JOIN LAteraL:

SELECT t.id,a.nr
FROM   tbl t,unnest(string_to_array(t.elements,')) WITH ORDINALITY a(elem,nr);

或者更简单如果基于实际数组(arr是数组列):

SELECT t.id,unnest(t.arr) WITH ORDINALITY a(elem,nr);

甚至,用最小的语法:

SELECT id,a,ordinality
FROM   tbl,unnest(arr) WITH ORDINALITY a;

a是自动的表和列别名。添加的序数列的名称为ordinality。但是添加显式列别名和表格限定列会更好(更安全,更清晰)。

Postgres 8.4 – 9.3

使用row_number()OVER(PARTITION BY id ORDER BY elem),您可以根据排序顺序获取数字,而不是字符串中原始序数位置的序数。

你可以简单地省略ORDER BY:

SELECT *,row_number() OVER (PARTITION by id) AS nr
FROM  (SELECT id,regexp_split_to_table(elements,') AS elem FROM tbl) t;

虽然这通常工作,我从来没有看到它在简单的查询中断,Postgresql断言没有关于没有ORDER BY的行的顺序。它恰好工作,由于实施细节。

要保证空白分隔字符串中元素的序数:

SELECT id,arr[nr] AS elem,nr
FROM  (
   SELECT *,generate_subscripts(arr,1) AS nr
   FROM  (SELECT id,string_to_array(elements,' ') AS arr FROM tbl) t
   ) sub;

或者更简单如果基于一个实际的数组:

SELECT id,nr
FROM  (SELECT *,generate_subscripts(arr,1) AS nr FROM tbl) t;

相关回答dba.SE:

> How to preserve the original order of elements in an unnested array?

Postgres 8.1 – 8.4

这些功能都不可用,但是:RETURNS TABLEgenerate_subscripts()unnest()array_length()
但这工作:

CREATE FUNCTION f_unnest_ord(anyarray,OUT val anyelement,OUT ordinality integer)
  RETURNS SetoF record LANGUAGE sql IMMUTABLE AS
'SELECT $1[i],i - array_lower($1,1) + 1
 FROM   generate_series(array_lower($1,1),array_upper($1,1)) i';

特别注意,数组索引可以不同于元素的序数位置。考虑这个演示具有扩展功能

CREATE FUNCTION f_unnest_ord_idx(anyarray,OUT ordinality int,OUT idx int)
  RETURNS SetoF record  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i],1) + 1,i
 FROM   generate_series(array_lower($1,1)) i';

SELECT id,arr,(rec).*
FROM  (
   SELECT *,f_unnest_ord_idx(arr) AS rec
   FROM  (VALUES (1,'{a,b,c}'::text[])  --  short for: '[1:3]={a,c}',(2,'[5:7]={a,c}'),(3,'[-9:-7]={a,c}')
      ) t(id,arr)
   ) sub;

 id |       arr       | val | ordinality | idx
----+-----------------+-----+------------+-----
  1 | {a,c}         | a   |          1 |   1
  1 | {a,c}         | b   |          2 |   2
  1 | {a,c}         | c   |          3 |   3
  2 | [5:7]={a,c}   | a   |          1 |   5
  2 | [5:7]={a,c}   | b   |          2 |   6
  2 | [5:7]={a,c}   | c   |          3 |   7
  3 | [-9:-7]={a,c} | a   |          1 |  -9
  3 | [-9:-7]={a,c} | b   |          2 |  -8
  3 | [-9:-7]={a,c} | c   |          3 |  -7

比较:

> Normalize array subscripts for 1-dimensional array so they start with 1

原文地址:https://www.jb51.cc/postgresql/193503.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐