如何解决在 Oozie 工作流中运行的 Hive 查询中使用用户名创建表名?
我有一个 Hive sql 脚本/操作作为 Oozie 工作流的一部分。我正在做一个 CREATE TABLE AS SELECT 来输出结果。我想使用用户名和附加字符串(例如“User123456_output_table”)命名表,但似乎无法获得正确的语法。
set tablename=${hivevar:current_user()};
CREATE TABLE `${hiveconf:tablename}_output_table` AS SELECT ...
这不起作用并给出:
Error while compiling statement: Failed: IllegalArgumentException java.net.URISyntaxException: Relative path in absolute URI: ${hivevar:current_user()%7D_output_table
或者改变第一行设置 tablename=${current_user()};开始运行 SELECT 查询,但最终停止:
Error while processing statement: Failed: Execution Error,return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. org.apache.hadoop.hive.ql.Metadata.HiveException: [${current_user()}_output_table]: is not a valid table name
或者改变第一行设置 tablename=current_user();开始运行 SELECT 查询,但最终停止:
Error while processing statement: Failed: Execution Error,return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. org.apache.hadoop.hive.ql.Metadata.HiveException: [current_user()_output_table]: is not a valid table name
或者,有没有办法通过参数从 Oozie 工作流中传递用户名?
我使用 Hue 来完成所有这些工作,而不是使用命令行。
谢谢
解决方法
这是错误的:set tablename=${hivevar:current_user()};
- 它不会按原样解决和替换。
Hive 在替换之前不会计算变量,它会按原样替换它们,变量中的所有函数都不会计算。变量只是文本替换。
这个:
set tablename=current_user();
CREATE TABLE `${hiveconf:tablename}_output_table` ...
解析为
CREATE TABLE `current_user()_output_table` ...
而且表名不支持函数,这样就不行了。
解决方案是在脚本之外计算函数,并将它们作为参数传递。
查看此博客:https://prodlife.wordpress.com/2013/12/06/parameterizing-hive-actions-in-oozie-workflows/
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。