如何解决'utf-8'编解码器无法解码位置4276中的字节0xa0:无效的起始字节
该文件中的编码为“ windows-1252”。采用:
open('txt.tsv', encoding='windows-1252')
解决方法
我尝试读取并打印以下文件:txt.tsv(https://www.sec.gov/files/dera/data/financial-statement-
and-notes-data-
sets/2017q3_notes.zip)
根据SEC,数据集以单一编码提供,如下所示:
制表符分隔值(.txt):utf-8,制表符分隔,\ n终止的行,第一行包含小写的字段名称。
我当前的代码:
import csv
with open('txt.tsv') as tsvfile:
reader = csv.DictReader(tsvfile,dialect='excel-tab')
for row in reader:
print(row)
所有尝试以以下错误消息结束:
‘utf-8’编解码器无法解码位置4276中的字节0xa0:无效的起始字节
我有点迷茫。谁能帮我?提前谢谢了。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。