技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

re模块与正则

时间：2020-08-16分类：正则表达式作者：编程之家

一.正则

正则就是用来筛选字符串中的特定的内容

正则表达式与re模块的关系:

　　1.正则表达式是一门独立的技术,任何语言都可以使用

　　2.python中药想使用正则表达式需要通过调用re模块

正则应用场景:

　　1.爬虫

　　2.数据分析

正则字符:

元字符	匹配内容
.	除换行符以外的任意字符
\n	换行符
\w	字母或数字或下划线
\s	任意的空白字符
\d	数字
\W	非字母或数字或下划线
\S	非空白字符
\D	非数字
\t	制表符
^	字符串的开始
$	字符串的结尾
\b	单词的结尾
a\|b	字符 a 或 b
()	匹配括号内的表达式,也表示一个组
[...]	匹配字符组中的字符
[^...]	匹配出了字符中的所有字符

量词	说明
*	重复零次或多次
+	重复一次或多次
?	重复零次或一次
{n}	重复 n 次
{n,}	重复 n 次或多次
{n,m}	重复 n 到 m 次

字符组概念

在同一位置可能出现各种字符 组成了一个字符组,在正则表达式中用[ ]表示,一个字符组内每次只能匹配一个字符,[ ]内的字符是或的关系

例:

匹配0-9数字 : [0123456789] 或 [1-9]
匹配A-Z字母 : 同上
匹配a-z字母 : 同上

　　ps: 字符组内范围必须从小到大必须按ASCII码表排序

^:以什么开头

　　^[1-9] : 匹配字符是否以1-9其中的数字为开头

$:以什么结尾

　　[a-z]$ : 匹配的字符是否以a-z其中的字母结尾

^...$:精准匹配固定长度的目标字符
- 　　^waller$ : 匹配waller
| :或
- 　　ab|abc 优先匹配 | 前面的内容,若前面内容匹配上 | 后面的内容不再匹配(在书写时把长的写在 | 前面)

　　　　　　

[^...] : 除括号内的内容其他都匹配

量词只能和元字符配合使用,并且是贪婪匹配

+ : 匹配1次或多次
- 　　匹配 13555555555,用 \d 每次只能匹配单个数字,要想把数字一次都匹配上要用 \d+
- 匹配到 1 条结果
* : 匹配零次或多次
- 　　
  匹配到 2 条结果
{n} : 指明重复个数

题:

轨道通道地道魔道人道
逐个匹配出后面的道:
- 　
  
  　
取出词:
- [^\s]{2} : 去掉空格,每次取两个字符
- .道 : 取出 .和道组成的词
- [^\s]. : [^\s]本身占了一个位置加 . 共取两个位置
-

匹配人名: 海燕海娇海东

　　

海.	取海和.组成的词	海燕海娇海东	匹配所有"海."的字符
^海.	只取以海和.为开头	海燕	只从开头匹配"海."
海.$	只取以海和.为结尾	海东	只匹配结尾的"海.$"

正则	待匹配字符	匹配结果	说明
李.?	李杰和李莲英和李二棍子	李杰李莲李二	?表示重复零次或一次，即只匹配"李"后面一个任意字符
李.*	李杰和李莲英和李二棍子	李杰和李莲英和李二棍子	*表示重复零次或多次，即匹配"李"后面0或多个任意字符
李.+	李杰和李莲英和李二棍子	李杰和李莲英和李二棍子	+表示重复一次或多次，即只匹配"李"后面1个或多个任意字符
李.{1,2}	李杰和李莲英和李二棍子	李杰和李莲英李二棍	{1,2}匹配1到2次任意字符

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：正则表达式和re模块下一篇：re模块和正则表达式

相关推荐

正则替换html代码中img标签的src值

正则替换html代码中img标签的src值在开发富文本信息在移动端展示的项目中，难免会遇到后台返回的标签文本信息中img标签src属性按照相对或者绝对路径返回的形式，类似：<img src="qinhancity/v1.0.0/ima

作者：嘻嘻哈哈biubiubiu 时间：2023-03-03

【C++】正则表达式

正则表达式

作者：Scott.L 时间：2022-12-20

shell之三剑客awk基础用法

AWK是一种处理文本文件的语言，是一个强大的文件分析工具。它是专门为文本处理设计的编程语言，也是行处理软件，通常用于扫描，过滤，统计汇总等工作，数据可以来自标准输入也可以是管道或文件。当读到第一行时，匹配条件，然后执行指定动作，在接着读取第二行数据处理，不会默认输出。如果没有定义匹配条件，则是默认匹配所有数据行，awk隐含循环，条件匹配多少次，动作就会执行多少次。逐行读取文本，默认以空格或tab键为分割符进行分割，将分割所得的各个字段，保存到内建变量中，并按模式或或条件执行编辑命令。与sed工作原理相比：s

作者：yu.deqiang 时间：2022-12-19

正则表达式

正则表达式是特殊的字符序列，利用事先定义好的特定字符以及他们的组合组成了一个规则，然后检查一个字符串是否与这种规则匹配来实现对字符的过滤或匹配。我们刚才在学习正则表达式的时候，我们表示数字，字母下划线的时候是用w表示的，为什么我们在书写的时候用的是w?我们可以发现我们分割空格的话，并没有达到我们预期的效果，这里我们可以使用正则表达式的方式进行分割。我们可以发现，我们和上面得到的结果不一致，既然出错了，肯定是我们的使用方式不对。看到这里我们就能感受到正则表达式的作用了，正则表达式是字符串处理的有力工具。

作者：熬夜磕代码丶时间：2022-12-19

Python基础知识进阶之正则表达式

Python界一名小学生，热心分享编程学习。

作者：漫步桔田时间：2022-12-19

开发者神器，代码文档终于有救了

收集整理每周优质开发者内容，包括、、等方面。每周五定期发布，同步更新到和。欢迎大家投稿，，推荐或者自荐开源项目/资源/工具/文章~

作者：七步编程时间：2022-11-22

Shell编程从看懂到看开③(函数、echo、printf、test)

本文涉及Shell函数，Shell中的echo、printf、test命令等。

作者：十八岁讨厌编程时间：2022-11-21

正则表达式常用最新版

常用正则表达，包括：密码、手机号、身份证、邮箱、中文、车牌号、微信号、日期 YYYY-MM-DD hh:mm:ss、日期 YYY-MM-DD、十六进制颜色、邮政编号、用户名、 QQ号

作者：Java Fans 时间：2022-11-21

Python正则表达式(持续更新，各种字符串筛选，总有一款适合您当前的功能)

一、python【re】的用法1、re.match函数·单一匹配-推荐指数【★★】2、re.search函数·单一匹配-推荐指数【★★★★★】3、re.findall函数·多项匹配-推荐指数【★★★★★】4、re.finditer函数·多项匹配-推荐指数【★★★★】5、re.sub函数·替换函数-推荐指数【★★★★】二、正则表达式示例·总有一款适合你1、正则表达式匹配HTML指定id/class的标签2、正则表达式匹配HTML中所有a标签中的各类属性值3、获取标签的文本值

作者：红目香薰时间：2022-11-20

编译原理实验一:词法分析器的自动实现(Lex词法分析)

1.借助词法分析工具Flex或Lex完成（参考网络资源）2.输入：高级语言源代码（如helloworld.c）3.输出：以二元组表示的单词符号序列。通过设计、编制、调试一个具体的词法分析程序，加深对词法分析原理的理解，并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。由于各种不同的高级程序语言中单词总体结构大致相同，基本上都可用一组正则表达式描述，所以构造这样的自动生成系统：只要给出某高级语言各类单词词法结构的一组正则表达式以及识别各类单词时词法分析程序应采取的语义动作，该系统

作者：zombotany智咏时间：2022-11-19

小编推荐

苹果市值2025年有望达4万亿美元