微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

AS3 正则表达式详解

转自:http://blog.csdn.net/cceevv/article/details/7765367


1.新建正则表达式,有两种方式
var exp1:RegExp = new RegExp("ABCD","g");
var exp2 = /ABCD/g;//g global 表示全局匹配

trace("ABCDEFABCD".match(exp1));
trace("ABCDEFABCD".match(exp2));//输出ABCD,ABCD,其中,字条串.match(表达式),返回一个匹配到的数组

2.元字符

1)"." 表示匹配任意单个字符(如:1,e,中,*等),可以是数字,字母,汉字,标点等特殊字符
如:
trace("this is a good Boo*".match(/.oo./g));//返回good,Boo*
但是如果匹配的正则子串本身要包含"."的话,就要用转义,如:
trace("this is a good Boo.".match(/.oo\./g));//返回Boo.

2)"^" 表示匹配字符串的起始处
(1) trace("ABAFT\nABALYN\nABOUT".replace(/^AB/g,'中国'));//把字符串起始处的"AB"替换为"中国" 返

回:
中国AFT\nABALYN\nABOUT
输入后变成:
中国AFT
ABALYN
ABOUT

在多行匹配中,匹配方式指定为m时,从每个\n后开始匹配

(2) trace("ABAFT\nABALYN\nABOUT".replace(/^AB/gm,'中国'));//m multiline表示多行的意思,即多行匹配
返回:
中国AFT\n中国ALYN\n中国OUT
输入后变成:
中国AFT
中国ALYN
中国OUT


注意:

trace("ABAFT\nABALYN\nABOUT".replace(/^AB/,'中国'));

trace("ABAFT\nABALYN\nABOUT".replace(/^AB/m,STHeiti; line-height:25px"> 以上两种方式匹配的结果都与(1)结果一样,所以要匹配多行时,"g"和"m"要同时使用

3)$ 表示匹配字符串结尾处,在多行匹配字符串中,匹配方式指定为m时,从每个\n前开始匹配

4)* 表示其前面的字符或表达式出现0次或多次,即任意次,次数>=0,如果0次或多次都满足的情况,取出现多次
如:/bo*/ 表示o可以出现0次或多次,bo,boo,boook,b,bk都匹配

5)+ 表示其前面的字符或表达式至少出现1次以上,即次数>=1,如果1次或多次满足的情况,取出现多次
如:/bo+/ 表示o可以出现1次以上,bo,boook都匹配,但b,bk不匹配

6)? 表示其前面的字符哎呀表达式可出现一次也可不出现,如果出现与可不出现两种都满足的情况,取出现一次
如:trace("This Book is Good Boooooook BoxBx".replace(/Bo?/g,'一'));
返回:This 一ok is Good 一ooooook 一x一x
其中Book既满足Bo,又满足B,也就是说o可出现也可不出现,取第一种情况,Bo

《关于最小匹配和最大匹配(贪婪模式和非贪婪模式)》

".*"

匹配 "内容A" "内容B" "内容C" 结果只有一个匹配结果,就是"内容A" "内容B" "内容C",

贪心模式尽可能的匹配到更长的内容,于是从第1个双引号开始直到最后一个双引号

".*?"

匹配 "内容A" "内容B" "内容C"

结果有3个匹配结果,分别是"内容A" 和 "内容B" 和 "内容C" . 非贪心模式尽可能少的匹配

7)() 表示把正则表达式的特定串组成一个组,作为一个整体
如:trace("AGoGo Is A Name AGo's Father".replace(/A(Go)*/g,'哈'));
把Go作为一个整体,即Go可出现任意次
返回:哈 Is 哈 Name 哈's Father

注意:组可以认为是正则表达式匹配模式的子模式,可以当做是一个普通的字符进行处理


(1)String.match()和RegExp.exec()捕捉了整个正则匹配的子串,同时捕捉了组匹配的子串
如:

trace("this is a good boboobooobooook".replace(/(bo+)*/,'book'));
bo+表示以b开头,o出现1次以上,然后再以组的形式出现任意多次
返回:this is a good book
/(bo+)*/ 这里相当于/(bo+)(bo+)(bo+)(bo+)/

(2)组的反向引用,即把前面定义的组引用过来,如/(bo+).*\1kie/
trace("this book is a goodbookie".replace(/(bo+).*\1kie/,'book'));
返回:this book
/(bo+).*\1kie/ 这里相当于/(bo+).*(bo+)kie/

(3)?:指定组所匹配的子串不被捕获
trace("this book is a good bookie".match(/b(o+)k./));
trace("this book is a good bookie".match(/b(?:o+)k./));
返回:
book,oo
book

(4)?=向前查找,即先匹配,再把符合某个特殊条件的取出来
如:
trace('flashmx flash8 flashcs3 flash4 flash5'.replace(/flash/g,'[FLAHSH]'));
trace('flashmx flash8 flashcs3 flash4 flash5'.replace(/flash(?=cs)/g,'[FLAHSH]'));

返回:
[FLAHSH]mx [FLAHSH]8 [FLAHSH]cs3 [FLAHSH]4 [FLAHSH]5
flashmx flash8 [FLAHSH]cs3 flash4 flash5

/flash(?=cs)/g是在/flash/g的基础之上加了(?=cs),
这样符合条件的有flashcs3 flashcs4 flashcs5三项,


?!向后查找,即先匹配,再把符合某个特殊条件的取出来
如:
trace('flashmx flash8 flashcs3 flashcs4 flashcs5'.replace(/flash/g,'[FLAHSH]'));
trace('flashmx flash8 flashcs3 flashcs4 flashcs5'.replace(/flash(?!cs[3-5])/g,'[FLAHSH]'));
返回:
[FLAHSH]mx [FLAHSH]8 [FLAHSH]cs3 [FLAHSH]cs4 [FLAHSH]cs5
[FLAHSH]mx [FLAHSH]8 flashcs3 [FLAHSH]cs4 [FLAHSH]cs5


/flash(?!cs[3-5])/g是在/flash/g基础之上加了(?!cs[3-5]),
即除了flashcs3,flashcs4,flashcs5以上的所有项

?=与?!相斥


8)[] 表示一个范围,里面的字符满足一个即可
如:/[bk]/ b,k都满足
/[a-zA-Z0-9] 26个小写字母,26个大写字母,10个数字其中任一个都满足


(1)
trace("32o498dslkfjjlkjLDSJFL70".match(/[^0-9]/g));
trace("32o498dslkfjjlkjLDSJFL7^0".match(/[^0-9]/g));
trace("32o498dslkfjjlkjLDSJFL7^0".match(/[0-9^]/g));

返回: o,d,s,l,k,f,j,L,D,S,J,F,L
o,^
3,2,4,9,8,7,^,0


如果把^放在[]字符集的开始处,表示取反的意思,如[^0-9],表示非数字,相当于\D
如果把^放在[]字符集的开始处,且被匹配的字符串含有^字符时,即表示取反的意思,又把^作为一个

通字符来看待,这样,非数字和^都满足,如上面的第二trace()

(2)在字符集中,"." 并不是一个元字符,而是当作一个普通字符看待,相当于用"\."转义
trace('sdfdsfdfl34l3re.'.match(/[0-9.]/g));
trace('sdfdsfdfl34l3re.'.match(/[0-9\.]/g));

返回:
3,3,.
3,.

(3)在字符集中,只有"-"和"\"是被认为是转义的,
如:[0-9] 表示从0到9的任一数字
[\n\t] 表示\n换行和\t制表位

trace('ldslfasdasd\nksdjlsd\t324123424'.replace(/[\n\t]/g,'转义'));
返回:ldslfasdasd转义ksdjlsd转义324123424


9)| 表示任选一,与[]功能相似
如:/b|k/ b,k都满足
/gook|book/ gook,book都满足
trace("this is a good cook book".replace(/good|book/g,'哈'));
返回:this is a 哈 cook 哈

注意:(1)
trace("this is a good book".replace(/[gk]/g,'哈'));
trace("this is a good book".replace(/g|k/g,'哈'));

返回:this is a 哈ood boo哈
this is a 哈ood boo哈
以上两个表达式效果是一样的

但是:trace("this is a good cook book".replace(/good|book/g,'哈'));
   trace("this is a good cook book".replace(/[goodbook]/g,'哈'));

返回:this is a 哈 cook 哈
   this is a 哈哈哈哈 c哈哈哈 哈哈哈哈
以上两个表达式效果是不一样的,因为|把good和book作为一个整体,而[]把good和book
合在一起,即goodbook,也就是说只要满足g,o,k其中任意一个字符就行了


10)- 表示一个范围,与[]一起用
如:trace("lLJ62-76DS5LFd-4Jlk-中国".match(/[a-z\-]/g));
[a-z\-]其中,a-z中的"-"是一个元字符,表示从a到z的一个范围,而\-转义后表示"-"字符


3.元序列
1){n}表示在它前面的字符或表达式必须重复n次,即次数=n
如: /bo{2}/,其中o要重复2次,boo满足,boook不满足

2){n,}表示在它前面的字符或表达式必须重复n次以上,即次数>=n,如果既满足n,又满足n+1,取n+1,即取最大的
如: /bo{2,}/,其中o要重复2次以上,boo满足,boook也满足

3){n,m}表示在它前面的字符或表达式必须重复n到m次以上,即n<=次数<=m,即取最大的
如:
trace("This Book is Good Boooooook BoxBx".replace(/Bo{2,6}/g,'哈'));
返回:This 哈k is Good 哈ok BoxBx

trace("This Book is Good Boook BoxBx".replace(/Bo{2,'哈'));
返回:This 哈k is Good 哈k BoxBx

4)\d 表示匹配数字字符,即0-9
\D 表示匹配非数字字符,与\d,即除了0-9之外的字符
\w 表示匹配一个单词字符,即26个小写字母,26个大写字母,10个数字,和下划线
\W 表示匹配非单词字符,与\w反义
\s 表示匹配任意空白字符
     \S 表示匹配任意非空间字符,与\s反义


4.标记
i ignoreCase 忽略大小写
g global 全局匹配
m multiline 多行模式
s dotall 指定元字符"."是否匹配"\n",即"\n"也作为一个普通字符处理
如:
trace("this is a book\nkie".replace(/bo+k.kie/g,'哈'));
trace("this is a book\nkie".replace(/bo+k.kie/gs,'哈'));//在这里,\n被看成是一个普通字符

返回:
this is a book
kie
this is a 哈

x extend 扩展模式,在扩展模式下,正则表示式的空白字符被忽略了,如/c _ d/ 的效果相当于 /c_d/


5.正则表达式的属性
source 可得到正则表达式的匹配模式,如:trace(/\d\d/.source);输出:\d\d
lastIndex 表示正则表达式在字符串中的起始匹配位置,只有当标记为g时才起作用

6.正则表达式的方法
exec(字符串) 返回一个Object
test(字符串) 返回一个Boolean值

2012/4/20 补充:

AS3正则表达式只能匹配同一行的内容,如果匹配的内容分散到多行是匹配不到的;

所以,如果必要应该先把换行符替换掉(content = content.replace(/\n/gi,"");)

然后再做其它匹配。

原文地址:https://www.jb51.cc/regex/358392.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐