微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

[NLP] 2.1 RE 正则表达式

本文整理自 TUM 的英文 NLP 课程。

正则表达式:使用代数符号(例如:+-*/)去表征,查找一系列的字符串,是一种非常简单的分类器(搜索器)。


符号 [ ]:里面的内容代表可选的字符

Pattern Matches
[wW]oodchuck Woodchuck or woodchuck
[1234567890] a single digit

符号 [ ‐ ]: 代表范围

Pattern Matches
[A-Z] 大写字符
[a-z] 小写字符
[0-9] 单一数字

符号 [^ ]: 排除某某(如果把^放在第一位)

Pattern Matches
[^A-Z] 大写字符
[^Ss] 既不是S,也不是s
[e^] e 或者 ^
[^e^] 既不是e,也不是^
a^b 就是 a^b嘛

符号 |: 选择

Pattern Matches
yours|mine yours或者mine
a|b|c 既不是S,也不是s
[gG]roundbog|[Ww]oodchuck 你懂的
grup(y|ies) gruppy 或 gruppies

未完结

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐