微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

spark与hive引擎差异致结果集不一致

sql样例

select *
from open.dws_openmall_item_inc_d a
where  a.log_date = '日期'
  and business = 'mall'
  and a.item_id=10022085

hive 执行有两条数据 spark执行有一条数据,经过排查发现存储路径如

 

 

表结构

 

 

spark 中任务前面有空格的数据字段是' 10022085' 而不是'10022085' 所以查询以上sql仅一条,hive有两条

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐