如何解决AWS Athena 在创建表时返回空行
我正在尝试使用以下语句在 AWS Athena 查询编辑器中创建一个表:
CREATE EXTERNAL TABLE IF NOT EXISTS somedb.soMetable (
Meta string,content string
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.regexserde'
WITH SERDEPROPERTIES (
'input.regex' = "\"([^\\n]*)\\n([^>]*)\"g"
)
LOCATION 's3://some-location/';
我正在尝试处理的文件如下所示:
>some Metadata
content line
content line
content line
content line
>some more Metadata
content line
content line
more content lines
目标是创建一个包含两列的表,一列是元数据,另一列是元数据下方描述的多行内容。经测试 using regex101 的正则表达式,似乎可以正常工作。
问题是查询数据返回空行。执行 SELECT count(*) FROM "somedb"."soMetable"
返回与正在处理的文件中的行数相同的数字。在我的例子中,文件有 63000 行,计数查询返回 63000。每行不包含任何数据。
还尝试使用 Athena 表向导创建表,得到相同的结果。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。