re模块主要用来进行正则匹配,常用方法如下:
#coding=utf-8
import re
str1 = "正则匹配"
#1. match()从字符串的开头进行匹配,如果匹配成功,返回匹配结果,否则返回None。
#第一个参数表示想要匹配的数据,第二个字符串表示从哪个数据中匹配
m1 = re.match(str1,"正则匹配的字符串规则")
m2 = re.match(str1,"这是正则匹配的字符串规则")
print "1.",m1,"--",m2
#2. search()扫描整个字符串,寻找与模式匹配的字符串,然后返回第一个匹配的对象,如果没有找到匹配,则为None。
s1 = re.search(str1,"这是正则匹配的字符串规则")
s2 = re.search(str1,"这是正则的字符串规则")
print "2.",s1,"--",s2
#3. findall()扫描整个字符串, 获取匹配的所有内容,以列表形式返回,如果没写匹配规则,则返回比原始字符串多一位的空字符串列表
f1 = re.findall('\d', 'a2b3c5')
f2 = re.findall('', 'a2b3c5')
print "3.",f1,"--",f2
r = re.match("([0-9]*)([a-z]*)([0-9]*)", "123456789")
#4.group()获取匹配到的所有结果,参数表示获得第几个匹配的结果。
print "4.",r.group(1)
#5.groups()获取分组后匹配到的所有结果,以元组的形式返回,如果没有分组,则返回空
print "5.",r.groups()
#6.span()返回匹配的区间,左闭右开。
print "6.",re.search("abc","123abc").span()
#7.split()分隔字符串,返回结果以列表形式显示。弥补了字符串的split()方法只能处理简单的、不支持多个分隔符的情况
s = "abc,def,g,hij,klim,opq"
print "7.",re.split(",", s)
运行结果: