微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

'utf-8'编解码器无法解码位置4276中的字节0xa0:无效的起始字节

如何解决'utf-8'编解码器无法解码位置4276中的字节0xa0:无效的起始字节

文件中的编码为“ windows-1252”。采用:

open('txt.tsv', encoding='windows-1252')

解决方法

我尝试读取并打印以下文件:txt.tsv(https://www.sec.gov/files/dera/data/financial-statement-
and-notes-data-
sets/2017q3_notes.zip)

根据SEC,数据集以单一编码提供,如下所示:

制表符分隔值(.txt):utf-8,制表符分隔,\ n终止的行,第一行包含小写的字段名称。

我当前的代码:

import csv

with open('txt.tsv') as tsvfile:
    reader = csv.DictReader(tsvfile,dialect='excel-tab')
    for row in reader:
        print(row)

所有尝试以以下错误消息结束:

‘utf-8’编解码器无法解码位置4276中的字节0xa0:无效的起始字节

我有点迷茫。谁能帮我?提前谢谢了。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。