如何解决通过火花访问 HBASE 中带有空格的数据集合
我在 HBASE 中有一个这种格式的表:
+--------------------+----------------+----------------+
| key| data:Campagne|data:Code client|
+--------------------+----------------+----------------+
|28_Campagne 1_100...| Campagne 1| 10000794|
|28_Campagne 1_100...| Campagne 1| 10001111|
|28_Campagne 1_100...| Campagne 1| 10001497|
|28_Campagne 1_100...| Campagne 1| 10001514|
|28_Campagne 1_100...| Campagne 1| 10001848|
|28_Campagne 1_100...| Campagne 1| 10001876|
|28_Campagne 1_100...| Campagne 1| 10002414|
|28_Campagne 1_100...| Campagne 1| 1000274|
|28_Campagne 1_100...| Campagne 1| 10002829|
如您所见,Code client
列中有一个空格。
如果我只阅读 key
和 Campagne
列,我使用这段代码:
columns_mapping = """
key STRING :key,campagne STRING data:Campagne
"""
df = (
spark.read.format("org.apache.hadoop.hbase.spark")
.option(
"hbase.table",tablename,)
.option(
"hbase.columns.mapping",columns_mapping,)
.option("hbase.use.hbase.context",False)
.option("hbase.config.resources","file:///etc/hbase/conf/hbase-site.xml")
.load()
)
key STRING :key,campagne STRING data:Campagne
+--------------------+----------+
| key| campagne|
+--------------------+----------+
|59_Campagne 1_100...|Campagne 1|
|59_Campagne 1_100...|Campagne 1|
|59_Campagne 1_100...|Campagne 1|
|59_Campagne 1_100...|Campagne 1|
当我尝试访问列 Code client
时,它返回一个错误:
# Same code but with a different columns_mapping
columns_mapping = """
key STRING :key,code_client STRING data:Code client
"""
IllegalArgumentException: "hbase.columns.mapping 的值无效 '\n key STRING :key,\n code_client STRING data:Code client\n '"
有没有办法访问这个列?我尝试在列名周围使用引号、双引号、反引号,但仍然存在相同的问题。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。