如何解决无论如何,是否需要更改外部配置单元表的非分区列的数据类型?
我正在尝试更改作为分区表的外部配置单元表的非分区列的数据类型?
例如,我有一个名为 trans 的分区表,其中有5列。 交易(数据类型=字符串),产品(数据类型=字符串),数量(数据类型=十进制(7,2)),年份(数据类型= int),星期(数据类型= int),日期(数据类型=日期)
trans表是外部表,并且按年,周,日划分。
现在,我必须将数量的数据类型从十进制(7,2)更改为十进制(15,2)。我们该怎么做?我不想用更新的数据类型重新处理整个表。是否有任何直接查询或命令来实现这一目标?
我确实使用了命令/查询:
ALTER TABLE trans CHANGE quantity quantity decimal(15,2);
但是这正在更改配置单元的metastore中的元数据的数据类型,但未更改数据级别,这意味着在Parquet文件中它没有更改数据类型,因此当我尝试从spark中选择数量列时,我正在下面提到的错误。
Py4JJavaError: An error occurred while calling o108.showString.
org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 2.0 Failed 10 times,most recent failure: Lost task 0.9 in stage 2.0 : java.lang.UnsupportedOperationException: org.apache.parquet.column.values.dictionary.PlainValuesDictionary$PlainIntegerDictionary
解决方法
大约有一个吉拉:HIVE-6784 - parquet-hive should allow column type change
由于性能影响,它以 Won't Fix
分辨率关闭,请阅读Jira注释以获取更多详细信息。
解决方案是create another table,insert overwrite from original table,then remove original table and rename new table
。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。