正则表达式（二）

最新推荐文章于 2025-11-29 13:42:57 发布

转载最新推荐文章于 2025-11-29 13:42:57 发布 · 58 阅读

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/hui-yue/p/5430657.html

文章标签：

\b：元字符，表示字符的开头或结尾，也就是单词的分界处。虽然通常英文的单词是由空格，标点符号或者换行来分隔的，但是\b并不匹配这些单词分隔字符中的任何一个，它只匹配一个位置。

.: 元字符，匹配除换行符之外的任意字符

*: 元字符，但是不是匹配字符，而是代表*前面的字符可以匹配零个或多个

+: 元字符，代表+前面的字符可以匹配一个或多个

?: 匹配零次或一次

\d: 元字符，匹配一位数字

-: 匹配本身，不是元字符

{4} 表示{}前面的必须刚好重复匹配4次

{5-12} 匹配5到12次

\s: 元字符，匹配任意的空白字符，包括空格，制表符，换行符，中文全角空格等

\w: 元字符，匹配字母、数字、下划线或者汉字（一是要看你的系统是什么系统，中文系统下是可以匹配汉字的二是要看你的应用环境，如果是在C#程序中，是可以匹配汉字的，在javascript或验证控件中，是不可以匹配汉字的其它\d，\s也是如此）

^: 匹配字符串的开始

$: 匹配字符串的结束

\: 用来匹配元字符，比如/. /*等

[]: 表示匹配中括号中的一个，[abcd]，a,b,c或d

(exp): 分组，捕获文本到自动命名的组里

(?'name'exp)或(?<name>exp) 捕获文本到名为name的组里

(?:exp) 不捕获内容，也不分配组号

(?=exp) 匹配exp之前的位置，自身出现位置的后面能匹配exp

(?<=exp) 匹配exp之后的位置，自身出现位置的前面能匹配exp

(?!exp) 断言此位置的后面不能匹配exp（使用反义可能会出错）

(?<!exp)

(?#...)或# 注释

限定符，分组（），后向应用（分组之后都有标号从左到右，第一个左括号标号1，第二个标号2..,使用/1来引用分组中的正则表达式），零宽断言，贪婪匹配与懒惰匹配

表4.常用分组语法
分类	代码/语法	说明
捕获	(exp)	匹配exp,并捕获文本到自动命名的组里
	(?<name>exp)	匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)
	(?:exp)	匹配exp,不捕获匹配的文本，也不给此分组分配组号
零宽断言	(?=exp)	匹配exp前面的位置
	(?<=exp)	匹配exp后面的位置
	(?!exp)	匹配后面跟的不是exp的位置
	(?<!exp)	匹配前面不是exp的位置
注释	(?#comment)	这种类型的分组不对正则表达式的处理产生任何影响，用于提供注释让人阅读

表7.尚未详细讨论的语法
代码/语法	说明
\a	报警字符(打印它的效果是电脑嘀一声)
\b	通常是单词分界位置，但如果在字符类里使用代表退格
\t	制表符，Tab
\r	回车
\v	竖向制表符
\f	换页符
\n	换行符
\e	Escape
\0nn	ASCII代码中八进制代码为nn的字符
\xnn	ASCII代码中十六进制代码为nn的字符
\unnnn	Unicode代码中十六进制代码为nnnn的字符
\cN	ASCII控制字符。比如\cC代表Ctrl+C
\A	字符串开头(类似^，但不受处理多行选项的影响)
\Z	字符串结尾或行尾(不受处理多行选项的影响)
\z	字符串结尾(类似$，但不受处理多行选项的影响)
\G	当前搜索的开头
\p{name}	Unicode中命名为name的字符类，例如\p{IsGreek}
(?>exp)	贪婪子表达式
(?<x>-<y>exp)	平衡组
(?im-nsx:exp)	在子表达式exp中改变处理选项
(?im-nsx)	为表达式后面的部分改变处理选项
(?(exp)yes\|no)	把exp当作零宽正向先行断言，如果在这个位置能匹配，使用yes作为此组的表达式；否则使用no
(?(exp)yes)	同上，只是使用空表达式作为no
(?(name)yes\|no)	如果命名为name的组捕获到了内容，使用yes作为表达式；否则使用no
(?(name)yes)	同上，只是使用空表达式作为no

转载于:https://www.cnblogs.com/hui-yue/p/5430657.html