如何将单元格中的文本与正则表达式匹配并仅保留与正则表达式匹配的文本？

时间：2020-07-11分类：正则表达式作者：佚名

我想做的是：有一个很大的excel表,有很多随意的客户信息.我想在新的Excel文件中以设置格式对电子邮件地址和其他数据进行排序.

我无法弄清楚如何匹配单元格文本(它将具有像地址电子邮件那样格式化和类似的格式)与正则表达式匹配,并且只保留列表中的正则表达式数据.

真的很感激一些帮助.谢谢

import sys,os,openpyxl
def sort_email_from_xl():
    sheet = sheet_select()   #Opens the worksheet
    emailRegex = re.compile(r'''([a-zA-Z0-9._%+-]+@+[a-zA-Z0-9.-]+(\.[a-zA-Z]{2,4}))''',re.VERBOSE)
    customeremails = []
    for row in range(0,max_row):
        if cell.text == emailRegex:
            mail = cell.text
            customeremails.append(mail)
            return customeremails
    print(customeremails)

这段代码应该可行(我只能测试正则表达式部分)：

import sys,openpyxl
def sort_email_from_xl():
    sheet = sheet_select()   #Opens the worksheet
    emailRegex = re.compile(".*?([a-zA-Z0-9\._%+\-]+@[a-zA-Z0-9.\-]+\.[a-zA-Z]{2,4}).*?")
    customeremails = []
    for row in range(0,max_row):
        if emailRegex.match(cell.text):
            mail = emailRegex.match(cell.text).groups()[0]
            cell.text = mail
            customeremails.append(mail)
    print(customeremails)

您的代码存在许多问题.首先关于正则表达式：

>正则表达式不允许在您的电子邮件地址周围添加文字,并添加.*？在开始和结束
>你不需要re.VERBOSE部分,因为如果你想为你的正则表达式添加内联注释,你只需要它,see doc
>您允许使用多个@的电子邮件地址
>您单独匹配TLD,这是不必要的

现在,电子邮件正则表达式适用于基本用法,但我明确建议从Stackoverflow上的其他答案中获取经过验证的电子邮件正则表达式.

然后：使用emailRegex.match(cell.text),您可以检查cell.text是否与您的正则表达式匹配,以及与emailRegex.match(cell.text).groups()[0]匹配,您只提取匹配的部分.你也有一个回复声明.

For some reason the above code is giving me a NameError: name ‘max_row’ is not defined

您需要纠正行中的循环,例如像documented here

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

相关推荐

正则替换html代码中img标签的src值

正则替换html代码中img标签的src值在开发富文本信息在移动端展示的项目中，难免会遇到后台返回的标签文本信息中img标签src属性按照相对或者绝对路径返回的形式，类似：<img src="qinhancity/v1.0.0/ima

【C++】正则表达式

正则表达式

shell之三剑客awk基础用法

AWK是一种处理文本文件的语言，是一个强大的文件分析工具。它是专门为文本处理设计的编程语言，也是行处理软件，通常用于扫描，过滤，统计汇总等工作，数据可以来自标准输入也可以是管道或文件。当读到第一行时，匹配条件，然后执行指定动作，在接着读取第二行数据处理，不会默认输出。如果没有定义匹配条件，则是默认匹配所有数据行，awk隐含循环，条件匹配多少次，动作就会执行多少次。逐行读取文本，默认以空格或tab键为分割符进行分割，将分割所得的各个字段，保存到内建变量中，并按模式或或条件执行编辑命令。与sed工作原理相比：s

正则表达式

正则表达式是特殊的字符序列，利用事先定义好的特定字符以及他们的组合组成了一个规则，然后检查一个字符串是否与这种规则匹配来实现对字符的过滤或匹配。我们刚才在学习正则表达式的时候，我们表示数字，字母下划线的时候是用w表示的，为什么我们在书写的时候用的是w?我们可以发现我们分割空格的话，并没有达到我们预期的效果，这里我们可以使用正则表达式的方式进行分割。我们可以发现，我们和上面得到的结果不一致，既然出错了，肯定是我们的使用方式不对。看到这里我们就能感受到正则表达式的作用了，正则表达式是字符串处理的有力工具。

Python基础知识进阶之正则表达式

Python界一名小学生，热心分享编程学习。

开发者神器，代码文档终于有救了

收集整理每周优质开发者内容，包括、、等方面。每周五定期发布，同步更新到和。欢迎大家投稿，，推荐或者自荐开源项目/资源/工具/文章~

Shell编程从看懂到看开③(函数、echo、printf、test)

本文涉及Shell函数，Shell中的echo、printf、test命令等。

正则表达式常用最新版

常用正则表达，包括：密码、手机号、身份证、邮箱、中文、车牌号、微信号、日期 YYYY-MM-DD hh:mm:ss、日期 YYY-MM-DD、十六进制颜色、邮政编号、用户名、 QQ号

Python正则表达式(持续更新，各种字符串筛选，总有一款适合您当前的功能)

一、python【re】的用法1、re.match函数·单一匹配-推荐指数【★★】2、re.search函数·单一匹配-推荐指数【★★★★★】3、re.findall函数·多项匹配-推荐指数【★★★★★】4、re.finditer函数·多项匹配-推荐指数【★★★★】5、re.sub函数·替换函数-推荐指数【★★★★】二、正则表达式示例·总有一款适合你1、正则表达式匹配HTML指定id/class的标签2、正则表达式匹配HTML中所有a标签中的各类属性值3、获取标签的文本值

编译原理实验一:词法分析器的自动实现(Lex词法分析)

1.借助词法分析工具Flex或Lex完成（参考网络资源）2.输入：高级语言源代码（如helloworld.c）3.输出：以二元组表示的单词符号序列。通过设计、编制、调试一个具体的词法分析程序，加深对词法分析原理的理解，并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。由于各种不同的高级程序语言中单词总体结构大致相同，基本上都可用一组正则表达式描述，所以构造这样的自动生成系统：只要给出某高级语言各类单词词法结构的一组正则表达式以及识别各类单词时词法分析程序应采取的语义动作，该系统

一文让你彻底搞懂js正则表达式

正则表达式通常被用来检索、替换那些符合某个模式（规则）的文本。例如：我们在写登录注册功能的时候使用的表单验证(对用户名、密码进行一些字符或长度进行限制) ===> (`匹配`) - 正则表达式还常用于过滤掉页面内容的一些敏感词汇。例如：我们平常在打游戏时候的口吐芬芳被换成了***:full_moon_with_face: ===> (`替换`) - 正则表达式从字符串中获取我们想要的特定部分。例如：我们在逛淘宝的时候在搜索框中搜索内容，会弹出很多与搜索相关的提示内容 ===> (`提取`) etc..

正则系列之手机号码正则

手机号码正则

正则表达式(全)

通过上面几个简单的示例，可以了解到常见的基础正则表达式的元字符主要包括以下几个^ 匹配输入字符串的开始位置。除非在方括号表达式中使用，表示不包含该字符集合。要匹配”^”字符本身，请使用"^"$ 匹配输入字符串的结尾位置。如果设置了RegExp对象的 Multiline属性，则"$”也匹配'n'或'r’,。要匹配”$"字符本身，请使用”$". 匹配除"rn"之外的任何单个字符反斜杠，又叫转义字符，去除其后紧跟的元字符或通配符的特殊意义* 匹配前面的子表达式零次或多次。...

编译原理实验1——词法分析程序设计原理与实现

给出补充后描述 C 语言子集单词符号的正则文法，设计并实现其词法分析程序。

【python】一篇玩转正则表达式

正则表达式（Regular Expression），又称规则表达式，它不是某个编程语言所特有的，是计算机科学的一个概念，通常被用来检索和替换符合某些规则的文本。

Python Re 正则表达式数据匹配提取基本使用

Python Re 正则表达式数据匹配提取基本使用

正则表达式——详情版+常用表达式

正则表达式：是用来描述字符串内容格式，使用它通常用于匹配一个字符串的内容是否符合格式要求

牛客刷题总结——Python入门08：面向对象、正则表达式

python的学习还是要多以练习为主，想要练习python的同学，推荐可以去牛客网看看，他们现在的IT题库内容很丰富，属于国内做的很好的了，而且是课程+刷题+面经+求职+讨论区分享，一站式求职学习网站，最最最重要的里面的资源全部免费!

38、Java 中的正则表达式单字符匹配和预定义字符

还不会正则表达式？放心我会出手万字教学

正则表达式详细教学。

热门文章

最新文章