引例:查找形如 333-333-3333的电话号码:
最坏是用for循环,然后一位一位找。好一些可以用正则表达式。
import re
# 正则表达式
phone_num_regex=re.compile(r'\d{3}-\d{3}-\d{4}')
mo=phone_num_regex.search("i want to kiss you in the phone -- 379-256-1399")
print("yes, I got the number:"+mo.group())
反斜杠加一个d的组合,就是数字。
如果说\\d, 就完全代表了反斜杠加一个d的组合,而反斜杠加一个d的组合,就是数字。
但是如果是\d, 就是转义字符,就像不会把\n单纯的理解为反斜杠加个n一样。
他就不是一个反斜杠加一个d了,就不是数字了。
分组
使用()分组。
phone_num_regex=re.compile(r'(\d{3})-(\d{3})-(\d{4})')
mo=phone_num_regex.search("i want to kiss you in the phone -- 379-256-1399")
print("area code:"+mo.group(1))
print("prefix:"+mo.group(2))
print("suffix:"+mo.group(3))
一次性获得所有分组/多重赋值
# 多次分组
kayako_phone_num_regex=re.compile(r'(\(\d{3}\))-(\d{3})-(\d{4})')
mo=kayako_phone_num_regex.search("i want to kiss you in the phone -- (379)-256-1399")
gps=mo.groups() # 不是group()...
p1,p2,p3=gps
print(p1,p2,p3, sep=' ')
- 使用
group()
获取特定的匹配组。 - 使用
groups()
获取所有捕获组的元组。