元字符
1 \d # 匹配任意一位数字 2 \D # 匹配任意单个非数字字符 3 \w # 匹配任意单个字母数字下划线字符,同义词是 [:alnum:] 4 \W # 匹配非数字型的字符
字符类:空白字符
1 \s # 匹配任意的空白符 2 \S # 匹配非空白字符 3 \b # 匹配单词的开始或结束 4 \n # 匹配换行符 5 \r # 匹配回车符 6 \t # 匹配制表符 7 \b # 匹配退格符 8 \0 # 匹配空值字符
字符类:锚定字符
1 \b # 匹配字边界(不在[]中时) 2 \B # 匹配非字边界 3 \A # 匹配字符串开头 4 \Z # 匹配字符串或行的末尾 5 \z # 只匹配字符串末尾 6 \G # 匹配前一次m//g离开之处
捕获
1 (exp) # 匹配exp,并捕获文本到自动命名的组里 2 (?<name>exp) # 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp) 3 (?:exp) # 匹配exp,不捕获匹配的文本,也不给此分组分配组号
零宽断言
1 (?=exp) # 匹配exp前面的位置 2 (?<=exp) # 匹配exp后面的位置 3 (?!exp) # 匹配后面跟的不是exp的位置 4 (?<!exp) # 匹配前面不是exp的位置 5 (?#comment) # 注释不对正则表达式的处理产生任何影响,用于注释
特殊字符
1 http://en.wikipedia.org/wiki/Ascii_table 2 ^H \010 \b 3 ^M \015 \r 4 匹配特殊字符: ctrl+V ctrl不放在按H或M 即可输出^H,用于匹配