微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

正则表达式的简单梳理


这篇博文我们按照每一种正则表达式符号来整理。

1)行首定位符“^”:匹配行首的字符

#-----------------------------/chapter8/ex8-2.sh------------------
#! /bin/bash

#列出/etc目录中的以字母po开头的文件
str=`ls /etc | grep "^po"`
echo "$str"

注意:str变量的赋值,即等号右边需要有反引号;其中用到了管道命令,grep命令处理对象是前面ls的结果,不然grep后面要接被处理文件名;正则表达式要用双引号""括起来,在awk、sed中是用两条反斜杠\...\括起来。


2)行尾定位符"$":匹配行尾的字符

#-----------------------------/chapter8/ex8-3.sh------------------
#! /bin/bash

#列出/etc目录中以conf结尾的文件名
str=`ls /etc | grep "conf$"`

echo "$str"

3)匹配整行:"^一整行内容$"


4)单个字符匹配".":可以代表任意字符,包括空格,不包括换行符\n

#-----------------------------/chapter8/ex8-4.sh------------------
#! /bin/bash

#列出所有的包含字符串“samba”的文件名
str=`ls /etc | grep "samba"`

echo "$str"

echo "==============================="

#列出包含字符串samba以及另外一个字符的文件名
str=`ls /etc | grep "samba."`

echo "$str"

注意:有了"."就表示一定有个字符在这儿,也可以用多个"."表示多个字符存在,例如"l..p"。


5)限定符"*":重复其前面的字符0次或者多次

#-----------------------------/chapter8/ex8-5.sh------------------
#! /bin/bash

#筛选出以字符s开头,紧跟着1个字符s,任意个字符s的文件名
str=`ls /etc | grep "^sss*"`

echo "$str"

注意:可以表达重复0次;正则表达式的*和linux shell中的*不一样,那个是表示匹配任意字符(串),不一定要是重复前面的字符,可以说范围更广。


6)字符集匹配“[]”:匹配中括号中的任意一个字符即可

#-----------------------------/chapter8/ex8-6.sh------------------
#! /bin/bash

#筛选所有以字符r开头,并且紧跟着1个字符c的文本行
str=`ls /etc |grep "^rc"`

echo "$str"<pre name="code" class="plain">#-----------------------------/chapter8/ex8-7.sh------------------
#! /bin/bash

#筛选以字符串“ss”开头,后面至少紧跟着1个字符“s”的文本行
str=`ls /etc | egrep "^sss+"`

echo "$str"

 

注意:[a-z]匹配小写字母,[A-Z]匹配大写字母,[a-zA-Z]匹配字母,[0-9]匹配数字。

当元字符“*”和 “.”在"[]"内时,只能表示一个普通的字符,没有上面的特殊含义了。


7)字符集不匹配“[^]”:功能和上面正好相反


8)限定符“+”:功能类似于"*",但是重复前面字符的次数必须大于等于1次,不能是0次

#-----------------------------/chapter8/ex8-7.sh------------------
#! /bin/bash

#筛选以字符串“ss”开头,后面至少紧跟着1个字符“s”的文本行
str=`ls /etc | egrep "^sss+"`

echo "$str"

9)限定符“?”:功能类似于“*”,但是重复其那面字符的次数必须只能是0次或1次

#-----------------------------/chapter8/ex8-8.sh------------------
#! /bin/bash

#筛选以字符串“ss”开头,后面跟着0或者1个s的文本行
str=`ls /etc | egrep "^sss?"`

echo "$str"


10)竖线"|"和圆括号"()":多个正则表示之间的或的关系

#-----------------------------/chapter8/ex8-9.sh------------------
#! /bin/bash

#筛选含有字符串“ssh”、“ssl”或者以字符串“yum”开头的文本行
str=`ls /etc | egrep "(ssh|ssl|^yum)"`

echo "$str"

11)"{m,n}"、"{m}"、"{m,}":指定重复出现的次数

前面的限定符"*","+","?"都可以重复前面的字符不同的次数,但是重复出现的次数都不可控。我们使用"{m,}"就可以控制重复出现的次数

"{m,n}":前置字符最少出现m次,最多出现n次;

"{m}":前置字符出现m次;

"{m,}":前置字符最少出现m次。

如果重复的字符不是唯一的呢?这时可以和中括号字符集匹配"[]"结合使用,如下:

#-----------------------------/chapter8/ex8-16.sh------------------
#! /bin/bash

#筛选符合格式的电话号码
str=`egrep "800-[[:digit:]]{3}-[[:digit:]]{4}$" demo4.txt`

echo "$str"

注意:在普通正则表达式中没有对{}的定义,需要加转义字符:\{m,n\}。


12)POSIX字符集可以方便表示"[]"的字符集


注意:使用POSIX字符集时需要两层中括号。

原文地址:https://www.jb51.cc/regex/360365.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐