如何解决为什么反向引用捕获组适用于 Java 中的多位数字?
假设您有一个字符串:
String string = "ab #1?AZa$ab #1?AZa$"
您正在尝试验证第十个字符是否为非空白字符,并且第二十个字符与第十个字符相同。此外,1号和11号、2号和12号、3号和13号等都有相应的验证,每个都有自己的要求(完整列表为here),因此您必须使用10个捕获组。我发现以下正则表达式仍然可以验证上述字符串:
string.matches("^([a-z])(\\w)(\\s)(\\W)(\\d)(\\D)([A-Z])([a-zA-Z])([aeIoUAEIoU])(\\S)\\1\\2\\3\\4\\5\\6\\7\\8\\9\\10$") //returns true
我的问题是关于最后的反向引用:
\\10
这不应该被解释为“与第一个字符匹配”然后“与0匹配”(数字)吗?我不明白这是如何解释为“与第十个字符匹配”而不以某种方式将 1 和 0 组合为 10。令人费解的是,用括号将 1 和 0 括起来是行不通的。
解决方法
Java 的行为记录在 Pattern 中:
在这个类中,\1 到 \9 总是被解释为反向引用,如果正则表达式中至少有那么多子表达式存在,则接受更大的数字作为反向引用,否则解析器将丢弃数字直到该数字小于或等于现有组数或为一位数。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。