微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

正则表达示

这里对正则表达示进行一定程度的总结.为避免太过纠结,这里避开一些 鸡肋 的正则用法.

更多文档参考官方文档 http://docs.oracle.com/javase/8/docs/api/java/util/regex/Pattern.html

字符

x 字符 x

\\ 反斜线字符

\t 制表符 ('\u0009')

\n 新行(换行)符 ('\u000A')

\r 回车符 ('\u000D')

\f 换页符 ('\u000C')

\a 报警 (bell) 符 ('\u0007')

\e 转义符 ('\u001B')

字符类

[abc] a、b 或 c(简单类)

[^abc] 任何字符,除了 a、b 或 c(否定)

[a-zA-Z] a 到 z 或 A 到 Z,两头的字母包括在内(范围)

[a-d[m-p]] a 到 d 或 m 到 p:[a-dm-p](并集)

[a-z&&[def]] d、e 或 f(交集)

[a-z&&[^bc]] a 到 z,除了 b 和 c:[ad-z](减去)

[a-z&&[^m-p]] a 到 z,而非 m 到 p:[a-lq-z](减去)

预定义字符类

. 任何字符(与行结束符可能匹配也可能不匹配)

\d 数字:[0-9]

\D 非数字: [^0-9]

\s 空白字符:[ \t\n\x0B\f\r]

\S 非空白字符:[^\s]

\w 单词字符:[a-zA-Z_0-9]

\W 非单词字符:[^\w]

边界匹配器

^ 行的开头

$ 行的结尾

\b 单词边界

\B 非单词边界

\A 输入的开头

\G 上一个匹配的结尾

\Z 输入的结尾,仅用于最后的结束符(如果有的话)

\z 输入的结尾


/*注:在Java 里表有些特殊的定义,参考API*/


Greedy 数量词 (贪婪)

X? X,一次或一次也没有

X* X,零次或多次

X+ X,一次或多次

X{n} X,恰好 n 次

X{n,} X,至少 n 次

X{n,m} X,至少 n 次,但是不超过 m 次

Reluctant 数量词 (非贪婪)

X?? X,一次或一次也没有

X*? X,零次或多次

X+? X,一次或多次

X{n}? X,恰好 n 次

X{n,}? X,至少 n 次

X{n,m}? X,至少 n 次,但是不超过 m 次


/*注:Possessive 这里不细说,参考API*/


Logical 运算符

XY X 后跟 Y

X|Y X 或 Y

(X) X,作为捕获组

Java 代码

publicclasstest2{
publicstaticvoidmatch(StringpatternStr,Stringstring){
Patternpattern=Pattern.compile(patternStr);
Matchermatcher=pattern.matcher(string);
if(matcher.find()){
//matcher.group()==matcher.group(0)代表整个表达示
for(inti=0,j=matcher.groupCount();i<=j;i++){
System.out.println(matcher.group(i));
}
}
}

/**
*@paramargs
*/
publicstaticvoidmain(String[]args){
//字符串区配
Pattern.matches("\\w","abcd");
//字符串替换
"abcdefg".replaceAll("^[\\w]{2}","aaaa");
//字符串筛选
Stringstr="abcde123fgabcd";
match("(\\w+)(\\d+)",str);
}
}

Oracle相关

--Oracle使用正则表达式的4个函数
--regexp_like(source_char,pattern,[match_parameter])
--与LIKE运算符相似,支持使用与此正则表达式与文本进行匹配
--regexp_substr(source_char,position,[occurrence],[match_parameter])
--为指定字符串的一部分与正则表达式建立匹配
--regexp_instr(source_char,[teturn_option],[match_parameter])
--返回与正则表达式匹配的字符和字符串的位置
--regexp_replace(source_char,replace_string,[match_parameter])
--提供一种修改与所给正则表达式匹配的字符串的方法

--参数说明
--source_char,输入的字符串,可以是列名或者字符串常量、变量。
--pattern,正则表达式。
--match_parameter,匹配选项.取值范围:i:大小写不敏感;c:大小写敏感;n:点号.不匹配换行符号;m:多行模式;x:扩展模式,忽略正则表达式中的空白字符。
--position,标识从第几个字符开始正则表达式匹配。
--occurrence,标识第几个匹配组。
--replace_string,替换的字符串。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐