微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

UnicodeDecodeError:'charmap'编解码器无法解码位置100的字节0x90:字符映射到<undefined>

如何解决UnicodeDecodeError:'charmap'编解码器无法解码位置100的字节0x90:字符映射到<undefined>

我在同一目录中有两个文件

1)http://nlp.lsi.upc.edu/awn/AWNDatabaseManagement.py.gz

2)阿拉伯语WordNet(http://nlp.lsi.upc.edu/awn/get_bd.php)upc_db.xml的xml数据库

当我尝试运行.py文件给我图像中的错误时 我正在尝试检查.py文件是否正常工作,以便可以将其作为WordNet导入阿拉伯语单词

您能帮我解决吗?!!!我被卡住了!

谢谢

image for error

解决方法

要读取任何二进制文件/数据库,请在打开文件/数据库时使用 encoding="uft-8"。 UTF-8 能够使用一到四个单字节代码单元对 Unicode 中的所有 1,112,064 个有效字符代码点进行编码。 所以,简单就是最好的。

,

要读取上述二进制文件

第369行:

使用>>> ent = open(ent,'rb')

代替

ent = open(ent)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。