前言:在实际开发中,正则表达式主要用在模式匹配(检查一个字符是否符合某种格式)和处理复杂的文本数据,例如查找,替换,分割。
定义:使用元字符(具有特殊意义的专用字符)组成的规则,提取,替换,验证指定的字符串。
在线测试:正则表达式测试
虽然正则表达式学一次忘一次,但是还是得学,学完忘了至少还有个影响,就算你到时候要用记不起来,问ai或者去百度的时候不会那么陌生。
我们来一起敲一敲吧:
import re
# 匹配字符 每个普通字符匹配其对应的字符
print(re.findall('123', '1234512398123'))
# 匹配两侧任意的正则表达式
print(re.findall('12|45', '1234512398123'))
# 匹配除换行外的任意一个字符
print(re.findall('张.丰', "张三丰,张四丰,张五丰"))
# 匹配字符集中的任意字符
print(re.findall('[aeiou]', "How are you?"))
# 匹配除了字符集中的任意字符
print(re.findall(r'\S', "Use 007 port"))
# \w 普通字符, \W 非普通字符
# 普通字符指的是字母、数字、下划线、汉字;非普通字符指符号。
print(re.findall(r'\w', "点评3497人,人均消费104元."))
print(re.findall('\W', "点评人数3497,人均消费104元."))
# \d 数字,\D 非数字
print(re.findall('\d', "点评人数3497,人均消费104元."))
print(re.findall('\D', "点评人数3497,人均消费104元."))
# \s 空白字符,\S 非空白字符
# 空字符指空格,\r 回车,\n 换行,\t 制表符,\f 换页符
# 重复匹配