1、只匹配字符串中的英文字母
>>> import re
>>> mys1 = "123456"
>>> mys2 = "123abc"
>>> mys3 = "abc123"
>>> mys4 = "abcdef"
>>> myl = [mys1, mys2, mys3, mys4]
>>> for s in myl:
res = re.findall(r"[a-zA-Z]+", s)
print res
[]
['abc']
['abc']
['abcdef']
注:同时也可以利用此来判断某字符串是否纯由数字所组成的,即如果返回结果为空列表时
2、只匹配字符串中的数字
>>> for s in myl:
res = re.findall(r"[0-9]+", s)
print res
['123456']
['123']
['123']
[]
注:同样地也可以用来判断某字符串是否由纯字母所组成, 即如果返回结果为空列表时
3、匹配字符串中的字母和数字
>>> for s in myl:
res = re.findall(r"[0-9a-zA-Z]+", s)
print res
['123456']
['123abc']
['abc123']
['abcdef']
4、正则表达式常用的符号和字符
由于 csdn 的表格太难看了,故使用 MarkDown 来编辑生成表格
5、但是经过上面的字符学习后,我们判断某字符串是否由纯数字或纯字母所组成时,可以写成如下的方式:
>>> for s in myl:
res = re.findall(r"^[0-9]+$", s)
print res
['123456']
[]
[]
[]
>>> for s in myl:
res = re.findall(r"^[a-zA-Z]+$", s)
print res
[]
[]
[]
['abcdef']
是 5 的方法好,还是 1 的方法好,个人觉得, 1 的方法的取巧性太强,在阅读代码时不够直观,而 5 的方法更加符合我们的一般思维,更容易理解,故 5 的方法更好。同样地
6、正则表达式函数与方法:
search(pattern, string, flags=0):在字符串 string 中查找正则表达式模式 pattern 的第一次出现,flags 是可选标识符,如果匹配成功,则返回一个匹配对象,否则返回 None
注:可以通过 result.group() 来访问返回结果内容
finditer(pattern, string[,flags=0]) :和 findall() 相同,但返回的不是列表而是迭代器,对于每个匹配,该迭代器返回一个匹配对象