正则表达式

这篇博客深入探讨了正则表达式中的各种flags,如g、i、m、u和y,以及它们在全局搜索、大小写忽略、多行匹配等方面的作用。同时,详细介绍了特殊字符类别如d、D、w、W、s和S,还有边界匹配如^、$和。文章还涵盖了分组、反向引用、先行断言和后行断言的概念,以及如何使用这些工具进行高效文本匹配。此外,讲解了捕获组和Unicode支持,帮助读者掌握正则表达式的高级用法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

正则flags的说明

g–全局匹配;找到所有匹配,而不是在第一个匹配后停止
i–忽略大小写
m–多行; 将开始和结束字符(^和$)视为在多行上工作(也就是,分别匹配每一行的开始和结束(由 \n 或 \r 分割),而不只是只匹配整个输入字符串的最开始和最末尾处
u–Unicode; 将模式视为Unicode序列点的序列
y–粘性匹配; 仅匹配目标字符串中此正则表达式的lastIndex属性指示的索引(并且不尝试从任何后续的索引匹配)

正则表达式中特殊字符的含义

字符类别(Character Classes)

.

点号,小数点,匹配任意单个字符(但不包括行结束符\n \r等)。
例如,/.y/ 匹配 “yes make my day” 中的 “my” 和 “ay”,但是不匹配 “yes”。

\d

匹配任意阿拉伯数字。等价于[0-9]。
例如,/\d/ 或 /[0-9]/ 匹配 “B2 is the suite number.” 中的 ‘2’。

\D

匹配任意一个不是阿拉伯数字的字符。等价于[^0-9]。
例如,/\D/ 或 /[^0-9]/ 匹配 “B2 is the suite number.” 中的 ‘B’。
PS:由于没有全局匹配,只能匹配到一个’B’就结束匹配。

\w

匹配任意来自基本拉丁字母表中的字母数字字符,还包括下划线。等价于 [A-Za-z0-9_]。
例如,/\w/ 匹配 “apple” 中的 ‘a’,”$5.28” 中的 ‘5’ 和 “3D” 中的 ‘3’。

\W

匹配任意不是基本拉丁字母表中单词(字母数字下划线)字符的字符。等价于 [^A-Za-z0-9]。
例如,/\W/ 或 /[^A-Za-z0-9]/ 匹配 “50%” 中的 ‘%’。

\s

匹配一个空白符,包括空格、制表符、换页符、换行符和其他 Unicode 空格。
例如 /\s\w*/ 匹配 “foo bar” 中的 ‘ bar’。

\S

匹配一个非空白符。
例如,/\S\w*/ 匹配 “foo bar” 中的 ‘foo’。
PS:经常使用[\s\S]来匹配所有字符。

其他

\t 匹配一个水平制表符(tab)
\r 匹配一个回车符(carriage return)
\n 匹配一个换行符(linefeed)
\v 匹配一个垂直制表符(vertical tab)
\f 匹配一个换页符(form-feed)
[\b] 匹配一个退格符(backspace)(不要与 \b 混淆)
\0 匹配一个 NUL 字符。不要在此后面跟小数点。
\xhh 匹配编码为 hh (两个十六进制数字)的字符。
\uhhhh 匹配 Unicode 值为 hhhh (四个十六进制数字)的字符。
\ 发生转义
例如, 是一个特殊字符,表示匹配某个字符 0 或多次,如 /a/ 意味着 0 或多个 “a”。 为了匹配字面意义上的 ,在它前面加上一个反斜杠,例如,/a*/匹配 ‘a’。

字符集合(Character Sets)

[xyz]

匹配集合中的任意一个字符。你可以使用连字符’-‘指定一个范围。
例如,[abcd] 等价于 [a-d],匹配”brisket”中的’b’和”chop”中的’c’。

[^xyz]

一个反义或补充字符集,也叫反义字符组。
例如,[^abc] 等价于 [^a-c]。 第一个匹配的是 “bacon” 中的’o’ 和 “chop” 中的 ‘h’。

边界(Boundaries)

^

匹配输入开始。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符后的开始处。
例如,/^A/ 不匹配 “an A” 中的 “A”,但匹配 “An A” 中的 “A”。

$

匹配输入结尾。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符的前的结尾处。
例如,/t$/ 不匹配 “eater” 中的 “t”,但匹配 “eat” 中的 “t”。

\b

如果符合要求就一直往后匹配,一直到无法匹配为止,这就是贪婪模式。所谓的惰性模式就是一旦匹配到合适的就结束,不在继续匹配下去了。

分组(Grouping)与反向引用(back references)

先行断言(lookahead)

先行肯定断言

x(?=y)
只有当 x 后面紧跟着 y 时,才匹配 x。
/Jack(?=Sprat|Frost)/ 只有在 ‘Jack’ 后面紧跟着 ‘Sprat’ 或 ‘Frost’ 时,才会匹配它。然而,’Sprat’ 或 ‘Frost’ 都不是匹配结果的一部分。

先行否定断言

x(?!y)
只有当 x 后面不是紧跟着 y 时,才匹配 x。
只有当 x 后面不是紧跟着 y 时,才匹配 x。例如,/\d+(?!.)/ 只有当一个数字后面没有紧跟着一个小数点时,才会匹配该数字。/\d+(?!.)/.exec(“3.141”) 匹配 141 而不是 3.141。

后行断言(lookbehind)

这是ES2018新加的标准

后行肯定断言

(?<=y)x
只有当 x 前面紧跟 y 时,才匹配 x。
例如:/(?<=$)\d+/.exec(‘$1000’) // 1000

后行否定断言

(?<!y)x
只有当 x 前面紧不是跟 y 时,才匹配 x。
例如:/(?<!$)\d+/.exec(‘$99¥1000’) // 99

捕获组
let re = /(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/u;
let result = re.exec('2015-01-02');
// result.groups.year === '2015';
// result.groups.month === '01';
// result.groups.day === '02';

// result[0] === '2015-01-02';
// result[1] === '2015';
// result[2] === '01';
// result[3] === '02';
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值