微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

为什么我的 python re 模式不适用于空格分割?

如何解决为什么我的 python re 模式不适用于空格分割?

我试图在英文和俄文的所有标点符号处拆分文本。这工作除了有空格。出于某种原因,\s 不起作用。 allRussianWords 最终包含空格,但我不希望它包含空格。 allRussianWords = re.split("[—…();«»!?.:,%\s\n]",words)

这是我试图拆分的字符串 words = "привет,моё имя Мэтт. Как ты?" 标点符号是俄语

解决方法

似乎您需要在右方括号后加一个 + 来匹配连续的字符。其他答案之一也指出了这一点。

\n 也是多余的,因为 \s 包含行返回字符。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。