- re.match函数尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回None
- re.search方法 扫描整个字符串并返回第一个成功的匹配
- re.match与re.search的区别在于re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None。而re.search匹配整个字符串,直到找到一个匹配
- compile 函数用于编译正则表达式,生成一个正则表达式( Pattern )对象,供 match() 和 search() 这两个函数使用
- findall在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表
- re.finditer在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回
- re.split 方法按照能够匹配的子串将字符串分割后返回列表
- re.sub替换函数,将正则表达式 pattern 匹配到的字符串替换为 repl 指定的字符串, 参数 count 用于指定最大替换次数
- 贪婪 vs 不贪婪:当重复一个正则表达式时,如用 a*,操作结果是尽可能多地匹配模式。 .* 的本质是“贪婪”的,在这种情况下,解决方案是使用不贪婪的限定符 *?、+?、?? 或 {m,n}?,尽可能匹配小的文本
课上随便练习 ↓ ↓ ↓
import string
import random
import re
z = []
x = string.ascii_letters + string.digits + "_.#%"
for i in range(10):
y = [random.choice(x)for i in range(random.randint(1,25))]
z.append(''.join(y))
print("列表:",z)
print("满足要求的字符串是:")
r = r'^[a-zA-Z]{1}[a-zA-Z0-9._]{4,19}$'
for i in z:
if re.findall(r,i):
print(i)
#效果 ↓ ↓ ↓
列表: ['17H25nj0oXvOr2wW7W#bSM9', '2_tygTMZ7ikqyddflYOh', '6DXL13QfExr', 'aSnSw7TtCC1AS', 'Sd_e#MA', 'ri5nPMFCTFu1ewS4rKOz.9j', 'vkhhIgVtyuqW.1X1gG1_', 'BNcFZ1xh', 'mAk', 'b0rgQ5FTUZL2x#8']
满足要求的字符串是:
aSnSw7TtCC1AS
vkhhIgVtyuqW.1X1gG1_
BNcFZ1xh
import random
import string
list1 = []
i = 0
while i<10:
c=random.choice(string.ascii_lowercase)
if c not in list1:
i+=1
list1.append(c)
print("原列表:",list1)
#效果 ↓ ↓ ↓
原列表: ['o', 'p', 'i', 'z', 'n', 'r', 't', 'x', 'y', 'e']
import string
s = input('请输入英文单词,用空格分隔:')
ss = string.capwords(s)
print('单词首字母大写:',ss)
#效果 ↓ ↓ ↓
请输入英文单词,用空格分隔:hello world
单词首字母大写: Hello World