惰性匹配:匹配尽可能长的子串
非惰性匹配:匹配最短子串
python中的正则表达式默认为惰性匹配,如一个字符串为:<xxx><xxx><xxx><xxx>,正则表达式为<*>,匹配的结果为<xxx><xxx><xxx><xxx>。如果要改变为非惰性匹配只用在结束符前加?即可。例子如下:
content = '<xxxx><xxxx><xxxx><xxxx>' #惰性匹配 print re.search('<.*>',content).span() #非惰性匹配 print re.search('<.*?>',content).span()
注:python 中 re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。