如何解决如果在移动表之前移动 Hive 表数据文件,会发生什么情况?
我正在尝试将表的位置移动到新目录。假设原始位置是 /data/dir
。例如,我正在尝试这样的事情:
hadoop fs -mkdir /data/dir_bkp
hadoop fs -mv /data/dir/* /data/dir_bkp
然后我执行 hive 命令,例如:
ALTER TABLE db.mytable RENAME TO db.mytable_bkp;
ALTER TABLE db.mytable_bkp SET LOCATION /data/dir_bkp;
在改变表的位置之前移动目录文件可以吗?运行这些命令后,表 mytable_bkp
是否会像以前一样填充?
解决方法
执行 mv
命令后,您的原始表将变为空。因为 mv 删除了数据文件。
重命名表后,它是空的,因为它的位置是空的。
执行 ALTER TABLE SET LOCATION
后 - 表为空,因为分区已安装到旧位置(现在为空)。抱歉之前在此步骤中误导了您。重命名表后,分区保持重命名前的状态。每个分区通常可以在表位置之外拥有自己的位置。
如果 table 是 MANAGED,请将其设置为 EXTERNAL:
alter table table_name SET TBLPROPERTIES('EXTERNAL'='TRUE');
现在删除表+使用新位置创建表并运行MSCK来创建分区:
MSCK [REPAIR] TABLE tablename;
如果您使用的是 Amazon EMR,请运行
ALTER TABLE tablename RECOVER PARTITIONS;
而不是 MSCK
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。