python中正则表达式与模式匹配

本文以《Python编程快速上手——让繁琐工作自动化》为例,讲述利用Python实现文本中特定内容提取的方式。需求是找出文本中所有电话号码和邮件地址,根据格式编写正则表达式,运行程序测试其提取功能,后续还想尝试用Python自动生成Verilog HDL中module的例化模板。

一、前言

  在之前找工作过程中,面试时经常被问到会不会python,懂不懂正则表达式。心里想:软件的东西和芯片设计有什么关系?咱也不知道因为啥用这个,咱也不敢问啊!在网上搜索到了一篇关于脚本在ASIC领域中应用的文章(原文见参考文献1),里边提到了python的用武之地:

  本文以《Python编程快速上手——让繁琐工作自动化》书中的示例,讲述利用python实现文本中特定内容提取的方式。

 二、提取特定内容示例

  需求:找出文本中所有的电话号码和邮件地址。设计方案:在剪贴板的文本中提取出所有与电话号码和邮件地址格式匹配的字符串。有了需求和设计方案,现根据电话号码和邮箱地址格式编写正则表达式。先来看看程序代码,再做讲解。

PhoneAndEmail.py

  此处电话号码的格式是:三个数字组成的区号(可选),三个数字,四个数字,任意数空格+ext/x/ext.+任意数空格+2到5个数字组成的分机号(可选)。每个部分间以“-”号连接。邮箱地址格式:由字母、数字以及_%+-符号组成的用户名,@符号以及.后的域名,域名由2-4个字母和数字集合组成。根据上述模式可编写对应的正则表达式。

  python的模式匹配有一个简单固定的套路,import导入re包,regex = re.compile('''<正则表达式>''')。<模式匹配的内容列表> = regex.findall(<待搜索字符串>)。三步搞定。编写正则表达式时,在字符串前加r防止字符转义。将各个部分分组并换行以提高代码的可读性,此时需要将re.VERBOSE作为re.compile()函数的第二个参数传入来忽略表达式中的空白和换行。

 三、运行结果

  复制代码首部注释掉的文本,然后运行程序。结果如下:

  前两行打印出了匹配内容的列表,之后以自定义的统一格式打印欲搜索的内容。程序运行结果正确。本文以一个小例子测试了python正则表达式提取文本特定内容的功能,之后想尝试利用python自动生成verilogHDL中module的例化模板。

 

 

 

 

 

价值1680元的python爬虫实战全套教学视频 New
2019最新python二级培训视频教程 heatlevel  ...23456..7
超细讲解Django打造大型企业官网  ...234
某科技的Python自动化测试培训课程  ...2345
Python数据科学技术详解与商业实践视频教程 heatlevel  ...23456
Python学习视频资料 heatlevel  ...23456..7
Python+OpenCV3.3图像处理系列视频教程 heatlevel  ...23456
JF教育Python第七期VIP培训视频教程  ...2345
廖雪峰Python量化金融项目+就业爬虫人工智能项目实战课程 heatlevel  ...23456
Python3数据分析与挖掘建模实战视频教程  ...2345
北风网Python零基础人工智能就业教程  ...2345
Python量化金融/量化投资视频教程合集  ...234
python编写抢票软件实战视频教程  ...2345
马哥python全栈+爬虫+高端自动化视频教程  ...2345
python flask高级编程视频教程  ...23
极客Python之效率革命视频教程  ...23
极客Python之Git实用视频教程  ...23
小象学院Python机器学习和算法高级版视频教程  ...23
尚硅谷python人工智能视频教程 attachment  ...23

转载于:https://www.cnblogs.com/alettarit/p/10829095.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值