微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

`re.Pattern.search()`

如何解决`re.Pattern.search()`

我收到了关于我编写的库的错误报告。症状是编译后的 searchPattern 方法引发 UnicodeDecodeError。 Python re 库文档未提及 UnicodeDecodeError

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 32: invalid start byte

search 的参数是 Windows 文件路径。我怀疑有问题的路径是格式错误的 UTF-16,并且与文件系统交互的(第三方、编译的、闭源的)代码正在创建一个格式错误的 Python 字符串对象,然后 search 是结果以不寻常的方式失败。不幸的是,我没有关于损坏的文件路径可能是什么的任何具体信息,因此我无法直接对其进行测试。

我的问题:

  1. 这是可能发生的事情吗?
  2. 在纯 Python 中是否有任何方法可以构造格式错误的 Python 字符串,或检查给定字符串是否格式错误

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。