2020-11-28 正则表达式_re模块

Python正则表达式_re模块详解

最新推荐文章于 2024-11-13 17:30:40 发布

原创最新推荐文章于 2024-11-13 17:30:40 发布 · 176 阅读

0 ·

CC 4.0 BY-SA版权

本文介绍了Python的re模块，包括re.match、re.search的区别，以及compile、findall、finditer、split和sub等函数的用法。还讨论了贪婪与非贪婪匹配的概念，是正则表达式学习的实践总结。

在这里插入图片描述

re.match函数尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回None
re.search方法扫描整个字符串并返回第一个成功的匹配
re.match与re.search的区别在于re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None。而re.search匹配整个字符串，直到找到一个匹配
compile 函数用于编译正则表达式，生成一个正则表达式（ Pattern ）对象，供 match() 和 search() 这两个函数使用
findall在字符串中找到正则表达式所匹配的所有子串，并返回一个列表，如果没有找到匹配的，则返回空列表
re.finditer在字符串中找到正则表达式所匹配的所有子串，并把它们作为一个迭代器返回
re.split 方法按照能够匹配的子串将字符串分割后返回列表
re.sub替换函数，将正则表达式 pattern 匹配到的字符串替换为 repl 指定的字符串, 参数 count 用于指定最大替换次数
贪婪 vs 不贪婪：当重复一个正则表达式时，如用 a*，操作结果是尽可能多地匹配模式。 .* 的本质是“贪婪”的，在这种情况下，解决方案是使用不贪婪的限定符 *?、+?、?? 或 {m,n}?，尽可能匹配小的文本

课上随便练习 ↓ ↓ ↓

import string
import random
import re
z = []
x = string.ascii_letters + string.digits + "_.#%"
for i in range(10):
    y = [random.choice(x)for i in range(random.randint(1,25))]
    z.append(''.join(y))
print("列表:",z)
print("满足要求的字符串是:")
r = r'^[a-zA-Z]{1}[a-zA-Z0-9._]{4,19}$'
for i in z:
    if re.findall(r,i):
        print(i)

#效果   ↓      ↓      ↓
 列表: ['17H25nj0oXvOr2wW7W#bSM9', '2_tygTMZ7ikqyddflYOh', '6DXL13QfExr', 'aSnSw7TtCC1AS', 'Sd_e#MA', 'ri5nPMFCTFu1ewS4rKOz.9j', 'vkhhIgVtyuqW.1X1gG1_', 'BNcFZ1xh', 'mAk', 'b0rgQ5FTUZL2x#8']
 满足要求的字符串是:
aSnSw7TtCC1AS
vkhhIgVtyuqW.1X1gG1_
BNcFZ1xh

import random
import string
list1 = []
i = 0
while i<10:
    c=random.choice(string.ascii_lowercase)
    if c not in list1:
        i+=1
        list1.append(c)
print("原列表:",list1)

#效果   ↓      ↓      ↓
原列表: ['o', 'p', 'i', 'z', 'n', 'r', 't', 'x', 'y', 'e']

import string
s = input('请输入英文单词，用空格分隔:')
ss = string.capwords(s)
print('单词首字母大写:',ss)

#效果   ↓      ↓      ↓
请输入英文单词，用空格分隔:hello world
单词首字母大写: Hello World