如何解决UnicodeDecodeError:'charmap'编解码器无法解码位置100的字节0x90:字符映射到<undefined>
我在同一目录中有两个文件
1)http://nlp.lsi.upc.edu/awn/AWNDatabaseManagement.py.gz
2)阿拉伯语WordNet(http://nlp.lsi.upc.edu/awn/get_bd.php)upc_db.xml的xml数据库
当我尝试运行.py文件给我图像中的错误时 我正在尝试检查.py文件是否正常工作,以便可以将其作为WordNet导入阿拉伯语单词
您能帮我解决吗?!!!我被卡住了!
谢谢
解决方法
要读取任何二进制文件/数据库,请在打开文件/数据库时使用 encoding="uft-8"
。
UTF-8 能够使用一到四个单字节代码单元对 Unicode 中的所有 1,112,064 个有效字符代码点进行编码。
所以,简单就是最好的。
要读取上述二进制文件
第369行:
使用>>> ent = open(ent,'rb')
代替
ent = open(ent)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。