微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – Pandas读取_excel:’utf-8’编解码器无法解码位置14的字节0xa8:无效的起始字节

试图读取MS Excel文件,版本2016.文件包含几个包含数据的列表.从DataBase下载的文件,可以在MS Office中正确打开.在下面的示例中,我更改了文件名.

编辑:文件包含俄语和英语单词.最有可能使用Latin-1编码,但编码=’latin-1’没有帮助

import pandas as pd
with open('1.xlsx', 'r', encoding='utf8') as f:
        data = pd.read_excel(f)

结果:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa8 in position 14: invalid start byte

没有encoding =’utf8′

'charmap' codec can't decode byte 0x9d in position 622: character maps to <undefined>

附:任务是处理52个文件,将每张表中的数据与52个文件中的相应表格合并.所以,请不要处理工作建议.

解决方法:

最有可能的问题是俄罗斯符号.

Charmap是认解码方法,用于没有注意到编码的情况.

正如我所看到的,如果utf-8和latin-1没有帮助,那么尝试不读取此文件

pd.read_excel(f)

pd.read_table(f)

甚至只是

f.readline()

为了检查什么是符号引发一个例外并删除这个符号/符号.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐