正则表达式 参数对照资料:
http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html
为了识别提取CA组合后续数字,学习了python自带模块re里的正则表达式。
1.demo
#encoding:UTF-8
import re
#re.compile(strPattern[,flag]):
#将正则表达式翻译成pattern对象
#strPattern为匹配的对象
#flag决定匹配的模式
pattern = re.compile(r'hello')
pattern1 = re.compile(r'(\d+)')
pattern2 = re.compile(r'\d+')
#re.match():
#match对象(调用match的返回值)是一次匹配的结果
#需要用match中提供的可读属性和方法去获取这些信息
m = pattern.match('hello,world')
if m:
print(m.group())
#search():
#pos和endpos的默认值分别为0和len(string))
s = pattern.search('wolrd hello')
if s:
print(s.group())
#split():
#按照能够匹配的子串将string分割后返回列表。maxsplit用于指定最大分割次数,#不指定将全部分割。
sp = pattern2.split('2he1ll2o3Bernie')
if sp:
print(sp)
#findall(string[, pos[, endpos]]) |re.findall(pattern, string[, flags]):
#搜索string,以列表形式返回全部能匹配的子串。
f = pattern1.findall('12321')
if f:
print(f)
#finditer()返回顺序访问的每一个匹配结果的迭代器
for fi inpattern2.finditer('1jkj2jkjl3lkjlk4'):
iffi:
print(fi.group())