如何解决如何从 Hadoop 数据库中将非 ACSII 字符读入 jupyterhub
我想读取包含 ACSII 字符以外的字符的数据(来自 Hadoop 数据库)。我正在尝试使用 .py 文件读取数据。我用过
#!/usr/bin/env python
# -*- coding: utf-8 -*-
指定编码。
我使用以下查询来提取数据。
def hiveconnection(host_name,port,user,database):
conn = hive.Connection(host=host_name,port=port,username=user,database=database,auth='KERBEROS',kerberos_service_name='impala')
cur = conn.cursor()
cur.execute(" select * from db_name.table_name ")
result = cur.fetchall()
return result
output = hiveconnection(host_name,database)
denialt2= pd.DataFrame(output)
我收到了错误消息。错误消息:“‘utf-8’编解码器无法解码位置 13 中的字节 0x96:无效起始字节”。在调查错误消息时,我知道它是由于 ASCII 字符以外的特殊字符而引发错误消息。从一列中粘贴下面的特殊字符。
附上完整的回溯(错误信息)。
请帮我解决这个问题。提前致谢:).
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。