微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Redshift Spectrum由分区列组成的过滤

如何解决Redshift Spectrum由分区列组成的过滤

以这种方式给出按日期划分的S3 Data-Lake:

year
|___month
    |___day
        |___file_*.json

我知道查询计划者受益于基于分区列的WHERE year = '2020' AND month = '08'之类的过滤器,通知它仅扫描特定月份的“文件夹”。

现在我的问题是,是否要以更复杂的方式表示过滤器:

...
WHERE (year + month + day)::date BETWEEN '2020-08-01' AND '2020-08-31'

Redshift Spectrum引擎仍然能够识别要访问8月的日分区吗?与前面的示例在性能上有实质性的区别吗?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。