js 中的正则捕获组

1.1 什么是捕获组

捕获组就是把正则表达式中子表达式匹配的内容,保存到内存中以数字编号或显式命名的组里,方便后面引用。当然,这种引用既可以是在正则表达式内部,也可以是在正则表达式外部。

捕获组有两种形式,一种是普通捕获组,另一种是命名捕获组,通常所说的捕获组指的是普通捕获组。语法如下:

普通捕获组:(Expression)

命名捕获组:(?Expression)

普通捕获组在大多数支持正则表达式的语言或工具中都是支持的,而命名捕获组目前只有.NET、PHP、Python等部分语言支持,据说Java会在7.0中提供对这一特性的支持。上面给出的命名捕获组的语法是.NET中的语法,另外在.NET中使用(?’name’Expression)与使用(?Expression)是等价的。在PHP和Python中命名捕获组语法为:(?PExpression)。

另外需要说明的一点是,除(Expression)和(?Expression)语法外,其它的(?…)语法都不是捕获组。

正则表达式:(\d{4})-(\d{2}-(\d\d))

编号命名捕获组匹配内容
0(\d{4})-(\d{2}-(\d\d))2008-12-31
1(\d{4})2008
2(\d{2}-(\d\d))12-31
3(\d\d)31

2 捕获组的引用

2.1 反向引用

捕获组捕获到的内容,不仅可以在正则表达式外部通过程序进行引用,也可以在正则表达式内部进行引用,这种引用方式就是反向引用。

反向引用的作用通常是用来查找或限定重复,限定指定标识配对出现等等。

对于普通捕获组和命名捕获组的引用,语法如下:

普通捕获组反向引用:\k,通常简写为\number

命名捕获组反向引用:\k或者\k’name’

普通捕获组反向引用中number是十进制的数字,即捕获组的编号;命名捕获组反向引用中的name为命名捕获组的组名。

反向引用涉及到的内容比较多,后续单独说明。

例子:jquery

    // Match a standalone tag
    rsingleTag = /^<(\w+)\s*\/?>(?:<\/\1>|)$/,

2.2 条件判断表达式

条件判断结构在平衡组中谈到过,基本应用和扩展应用都可以在其中找到例子,这里不再赘述,请参考 .NET正则基础之——平衡组。

2.3 程序中引用

根据语言的不同,程序中对捕获组引用的方式也有所不同,下面就JavaScript 进行举例说明。

由于JavaScript中不支持命名捕获组,所以对于捕获组的引用就只支持普通捕获组的 反向引用$number 方式的引用。程序中的引用一般在替换和匹配时使用。

1) 在Replace中引用,通常是通过$number方式引用。

    var data = "<table id=\"test\"><tr class=\"light\"><td> test </td></tr></table>";
    var reg = /<([a-z]+)[^>]*>/ig;
    console.log(data.replace(reg, "<$1>"));

    //输出 <table><tr><td> test </td></tr></table>

2) 在匹配时的引用,通常通过RegExp.$number方式引用。

    var data = [' <img alt="" border="0" name="g6-o44-1" onload="DrawImage" src="/bmp/foo1.jpg" />', ' <img src="/bmp/foo2.jpg" alt="" border="0" name="g6-o44-2" onload="DrawImage" />'];
    var reg = /<img\b(?=(?:(?!name=).)*name=(['"]?)([^'"\s>]+)\1)(?:(?!src=).)*src=(['"]?)([^'"\s>]+)\3[^>]*>/i;
    for(var i = 0; i < data.length; i++) {
        var s = data[i];

        if(reg.test(s)) {console.log('234')
            document.getElementById("result").value += "name: " + RegExp.$2 + "\n";
            document.getElementById("result").value += "src: " + RegExp.$4 + "\n";
        }
    }
### JavaScript 正则表达式捕获组详解 #### 捕获组的概念 在正则表达式中,捕获组用于将一部分模式括起来以便于后续引用这部分匹配到的内容。这使得可以在同一个正则表达式内部重用这些子串,也可以在完成匹配之后获取它们。 #### 创建捕获组的方法 通过圆括号 `()` 来定义捕获组,在此范围内的任何字符都将被视作一个整体参与匹配过程,并且会被记录下来作为单独的实体[^2]。 #### 反向引用与替换操作 当需要在一个字符串替换的过程中使用之前捕获的部分时,则可以通过 `$n` 的形式访问第 n 个捕获组的数据。例如: ```javascript var str = "Hello World"; // 定义带有两个捕获组正则表达式 var re = /(\w+)\s*(\w+)/; // 替换并交换位置 console.log(str.replace(re, "$2, $1")); // 输出:"World, Hello" ``` 上述例子展示了如何利用捕获组实现简单的单词顺序颠倒功能。这里第一个捕获组 `(\\w+)` 和第二个捕获组也是一样,分别对应了原句中的 “Hello” 和 “World”。 #### 实际应用案例 考虑更复杂的场景——提取URL参数名及其对应的值: ```javascript function parseQueryString(queryString) { var params = {}; queryString.split('&').forEach(function(part){ if (part !== "") { part = decodeURIComponent(part); var eqIndex = part.indexOf('='); var key = eqIndex > -1 ? part.substr(0, eqIndex) : part; var val = eqIndex > -1 && part.length-1 > eqIndex ? part.substr(eqIndex+1) : null; // 利用捕获组解析键值对 var matchKeyVal = /^([^=]+)=(.*)$/.exec(key+"="+val); if(matchKeyVal != null){ params[matchKeyVal[1]] = matchKeyVal[2]; } } }); return params; } console.log(parseQueryString("name=John&age=30")); // 结果:{ name: 'John', age: '30' } ``` 在这个实例里,程序会遍历查询字符串里的每一项,并运用正则表达式的捕获特性来分离出每一对名称和数值。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值