在Python中,有4个常见的正则处理文本的场景:校验文本内容;提取文本内容;替换文本内容;切割文本内容。
1、校验文本内容
Python中,正则处理相关的方法在re包中,可以使用re.match 或 re.search来校验文本。
import re
myre = re.compile(r'\A\d{4}-\d{2}-\d{2}\Z')
#\A开始匹配,\Z匹配结束
print(myre.match('2020-07-08') is not None)
print(myre.search('2020-07-08') is not None)
2、提取文本内容
Python中,使用re.findall()来提取文本内容。当有子组的时候,会返回子组的内容,没有子组时,返回整个正则匹配到的内容。
import re
#没有子组时
myre = re.compile(r'\d{4}-\d{2}')
print(myre.findall('2020-07 2020-08'))
#有子组时
myre1 = re.compile(r'(\d{4})-(\d{2})')
print(myre1.findall('2020-07 2020-08'))
# ['2020-07', '2020-08']
# [('2020', '07'), ('2020', '08')]
#使用迭代器遍历匹配后内容
for match in myre1.find