微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

带有子查询的 Hive Where 子句 - 仅允许作为顶级连接词的 SubQuery 表达式

如何解决带有子查询的 Hive Where 子句 - 仅允许作为顶级连接词的 SubQuery 表达式

我需要从 tableA 中获取大于 cdc_date 的所有记录,该记录存储在另一个 tmp_table 中

tmp_table 只有一列 cdc_date 和只有一条记录。

tableA 有超过 500 万条记录。

我的 Hive 查询

number

我收到以下错误

Select count(*) from tableA as a 
where unix_timestamp((concat_ws('-',a.year,a.month,a.day,a.hour)),"yyyy-MM-dd-HH") > 
(select b.cdc_date from tmp_table as b)

谁能建议如何激活它。

解决方法

你需要重写sql -

Select count(*) from tableA as a 
Left join tmp_table b
On unix_timestamp((concat_ws('-',a.year,a.month,a.day,a.hour)),"yyyy-MM-dd-HH") > 
b.cdc_date
,

与单行表交叉连接:

Select count(*) 
 from tableA as a 
      cross join tmp_table b
where unix_timestamp((concat_ws('-',"yyyy-MM-dd-HH") > b.cdc_date

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。