Python 初学习系列(三)

前言

提示:继续Python学习,这部分是自动化任务部分,先学习模式匹配和正则表达式。

第七章:模式匹配和正则表达式

介绍python如何用正则表达式处理字符串,以及查找文本模式。

假设希望在字符串中查找电话号码,已知模式:3个数字,一个短横线,3个数字,1个短横线,最后3个数字,例如:122-333-4444.。当不用正则表达式编写代码如下:

def isPhoneNumer(text):
    if len(text)!=12:
        return False
    for i in range(0,3):
        if not text[i].isdecimal():
            return False
    if text[3]!='-':
        return False
    for i in range(4,7):
        if not text[i].isdecimal():
            return False
    if text[7]!='-':
        return False
    for i in range(8,12):
        if not text[i].isdecimal():
            return False
    return True
print(isPhoneNumer('111-222-2222'))
print(isPhoneNumer('111-222-222'))
print(isPhoneNumer('1111-222-222'))
结果
True
False
False

必须添加更多代码,才能在更长的字符串中寻找这种文本模式,例子如下:

message='Call me at 412-222-2222 tomorrow.122-344-2345 is my office.'
for i in range(len(message)):
    chunk =message[i:i+12]
    if isPhoneNumer(chunk):
        print('Phone number found:'+chunk)
print('Done')
结果
Phone number found:412-222-2222
Phone number found:122-344-2345
Done

正则表达式,简称regex,是文本模式的描述方法。例如,\d是一个正则表达式,表示一个数字字符,即任何0到9的数字。Python使用正则表达式\d\d\d-\d\d\d-\d\d\d\d可以完成前面查找电话的功能。正则表达式可以很复杂,例如在一个模式后加上花括号包围的3({3}),就是匹配这个模式三次,所以可简化为\d{3}-\d{3}-\d{4}。

Python中所有正则表达式的函数都在re模块中。向re.compile()传入一个字符串值,表示正则表达式,将返回一个Regex模式对象。创建一个Regex对象来匹配电话号码模式,代码如下:

import re
phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')

此时phoneNumRegex变量包含一个Regex对象。匹配Regex对象的过程中,Regex对象的search()方法查找传入的字符串,寻找该正则表达式的所有匹配。如果字符串中没有找到该正则表达式模式,search()方法就返回None。如果找到该模式,search()方法将返回一个Match对象。Match对象有一个Group()方法,返回被查找字符串中实际匹配的文本。例子如下:

import re
phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')
mo = phoneNumRegex.search('My number is 415-222-3464.')
print('Phone number found: '+mo.group())
结果
Phone number found: 415-222-3464

小知识:在字符串前加小写r,可以将该字符串标记为原始字符串,不包括转义字符。

总结下正则表达式的几个步骤:首先用import re 导入正则表达式模块;然后用re.compile()函数创建一个Regex对象(记得使用原始字符串);接着向Regex对象的search()方法传入想查找的字符串,将返回一个Match对象;最后调用Match对象的group()方法,返回实际匹配文本的字符串。

假如想要将区号从电话号码中分离,添加括号将在正则表达式中创建分

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值