微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用 presto

如何解决使用 presto

我有使用 AWS glue 抓取的数据,我正在使用 Athena(即 Presto)进行查询。数据原本是JSON。

我感兴趣的数据如下所示:

{ ...
  [ ...
    { 'items' : [
      {
        'label' : 'label-a','description' : 'description-a'
      },{
        'label' : 'label-b','description' : 'description-b'
      },...]
...}

多亏了 glue,'items' 已经被表示为一个对象数组。

对于我来说,为了获得给定特定“标签”的“描述”输出,最好的方法是什么? 例如,获取标签为“label-a”的所有项目的描述

解决方法

如果你有一列 items 是一个对象数组,你可以这样做:

select x.description from mytable cross join unnest(items) t(x)
where x.label='label-a'

说明:unnest 将“展开”数组并将其表示为一个表 t,其中包含一个 x 列(您的对象)。数组中的每个元素都是表 t 中的一行。对于给定行的数组 x 中的所有条目,交叉联接会将对象 items 作为列附加到当前行。然后,您只需将标签值的条件添加为 x.label = ...

在此处查看 unnest 上的文档:https://prestodb.io/docs/current/sql/select.html#unnest

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。