js正则表达式

最新推荐文章于 2024-11-09 11:02:07 发布

原创最新推荐文章于 2024-11-09 11:02:07 发布 · 229 阅读

0 ·

CC 4.0 BY-SA版权

正则表达式专栏收录该内容

4 篇文章

订阅专栏

js正则表达式基础入门

1.正则表达式是什么

正则表达式(regular expression)描述了一种字符串匹配的模式，可以用来检查一个字符串是否含有某种子串、将匹配的子串做替换或者从某个字符串中取出符合某个条件的子串等。

说白了正则表达式就是处理字符串的,我们可以用它来处理一些复杂的字符串。

2.正则表达式的创建方式

字面量创建方式

 var reg = /pattern/flags

实例创建方式

var reg = new RegExp(pattern,flags);

pattern:正则表达式
flags:标识(修饰符)

标识主要包括：
1. i 忽略大小写匹配
2. m 多行匹配，即在到达一行文本末尾时还会继续寻常下一行中是否与正则匹配的项
3. g 全局匹配 模式应用于所有字符串，而非在找到第一个匹配项时停止

字面量创建方式和构造函数创建方式的区别

字面量创建方式不能进行字符串拼接，实例创建方式可以

var regParam = 'cm';
var reg1 = new RegExp(regParam+'1');
var reg2 = /regParam/;

字面量创建方式特殊含义的字符不需要转义，实例创建方式需要转义

var reg1 = new RegExp('\d');  //    /d/ 
var reg2 = new RegExp('\\d')  //   /\d/
var reg3 = /\d/;              //  /\d/

3.元字符

特殊含义的元字符

元字符	意义
\d	0-9之间的任意一个数字 \d只占一个位置
\w	数字，字母，下划线 0-9 a-z A-Z _
\s	空格或者空白等
\D	除了\d
\W	除了\w
\S	除了\s
.	除了\n之外的任意一个字符
\	转义字符
\|	或者
()	分组
\n	匹配换行符
\b	匹配边界字符串的开头和结尾空格的两边都是边界 => 不占用字符串位数
^	限定开始位置 => 本身不占位置
$	限定结束位置 => 本身不占位置
[a-z]	任意字母 []中的表示任意一个都可以
[^a-z]	非字母 []中^代表除了
[abc]	abc三个字母中的任何一个 [^abc]除了这三个字母中的任何一个字符

量词元字符

元字符	意义
*	0到多个
+	1到多个
?	0次或1次可有可无
{n}	正好n次；
{n,}	n到多次
{n,m}	n次到m次

量词出现在元字符后面如\d+，限定出现在前面的元字符的次数

var str = '1223334444';
var reg = /\d{2}/g;
var res = str.match(reg);
console.log(res)  //["12", "23", "33", "44", "44"]

练习一下

[12]表示1或者2 不过[0-9]这样的表示0到9 [a-z]表示a到z

Q：匹配从18到65年龄段所有的人

var reg = /[18-65]/;

//这个正则表达式的作用是啥？
var reg = /^\s+|\s+$/g;
//两者可以干嘛 
var res = str.replace(reg,'');

4.正则运算符的优先级

1.正则表达式从左到右进行计算，并遵循优先级顺序，这与算术表达式非常类似。
2.相同优先级的会从左到右进行运算，不同优先级的运算先高后低。
3.一般用 | 的时候，为了提高 | 的优先级，我们常用()来提高优先级。

运算符	描述
\	转义符
(), ( ?: ), (?=), []	圆括号和方括号
*, +, ?, {n}, {n,}, {n,m}	限定符
^, $, \任何元字符、任何字符	定位点和序列（即：位置和顺序）
\|	替换，"或"操作

优先级重上而下

5.正则的特性

贪婪性

所谓的贪婪性就是正则在捕获时，每一次会尽可能多的去捕获符合条件的内容。
如果我们想尽可能的少的去捕获符合条件的字符串的话，可以在量词元字符后加?

懒惰性

懒惰性则是正则在成功捕获一次后不管后边的字符串有没有符合条件的都不再捕获。
如果想捕获目标中所有符合条件的字符串的话，我们可以用标识符g来标明是全局捕获

 var str = '123aaa456';
 var reg = /\d+/;  //只捕获一次,一次尽可能多的捕获
 var res = str.match(reg)
 console.log(res);
 
 reg = /\d+?/g; //解决贪婪性、懒惰性
 res = str.match(reg)
 console.log(res)

6.正则的四个方法

主要介绍下： test、exec、match和replace这四个方法。

test
reg.test(str) 用来验证字符串是否符合正则符合返回true 否则返回false；

var str = 'abc';
var reg = /\w+/;
console.log(reg.test(str));  //true

exec
reg.exec() 用来捕获符合规则的字符串

var str = 'abc123cba456aaa789';
var reg = /\d+/;
console.log(reg.exec(str))
//  ["123", index: 3, input: "abc123cba456aaa789"];
console.log(reg.lastIndex)
// lastIndex : 0 

reg.exec捕获的数组中 
// [0:"123",index:3,input:"abc123cba456aaa789"]
0:"123" 表示我们捕获到的字符串
index:3 表示捕获开始位置的索引
input 表示原有的字符串

这里重点说下，exec方法在正则表达式中有/g,即全局搜索。表现的不一样。

var str = 'abc123cba456aaa789';
var reg = /\d+/g;  //此时加了标识符g
console.log(reg.lastIndex)
// lastIndex : 0 

console.log(reg.exec(str))
//  ["123", index: 3, input: "abc123cba456aaa789"]
console.log(reg.lastIndex)
// lastIndex : 6

console.log(reg.exec(str))
// ["456", index: 9, input: "abc123cba456aaa789"]
console.log(reg.lastIndex)
// lastIndex : 12

console.log(reg.exec(str))
// ["789", index: 15, input: "abc123cba456aaa789"]
console.log(reg.lastIndex)
// lastIndex : 18

console.log(reg.exec(str))
// null
console.log(reg.lastIndex)
// lastIndex : 0

每次调用exec方法时,捕获到的字符串都不相同
lastIndex ：这个属性记录的就是下一次捕获从哪个索引开始。
当未开始捕获时，这个值为0。          
如果当前次捕获结果为null。那么lastIndex的值会被修改为0.下次从头开始捕获。
而且这个lastIndex属性还支持人为赋值。

match
str.match(reg) 如果匹配成功，就返回匹配成功的数组，如果匹配不成功，就返回null

match 和 exec 在非全局搜索，结果是一样的
ar str = 'abc123cba456aaa789';
var reg = /\d+/;
console.log(reg.exec(str));
//["123", index: 3, input: "abc123cba456aaa789"]
console.log(str.match(reg));
//["123", index: 3, input: "abc123cba456aaa789"]
but

在全局搜索中
var str = 'abc123cba456aaa789';
var reg = /\d+/g;
console.log(reg.exec(str));
// ["123", index: 3, input: "abc123cba456aaa789"]
console.log(str.match(reg));
// ["123", "456", "789"]

当全局匹配时，match方法会一次性把符合匹配条件的字符串全部捕获到数组中。

match 和 exec 都受分组（）的影响。具体的就不谈了，实际用不到。

replace
str.replace() 这个方法大家肯定不陌生，现在我们要说的就是和这个方法和正则相关的东西了。

var str = 'a111bc222de';
var res = str.replace(/\d/g,'Q')
console.log(res)
// "aQQQbcQQQde"

replace的第二个参数也可以是一个函数
str.replace(reg,fn);

var str = '2017-01-06';
str = str.replace(/-\d+/g,function(){
    console.log(arguments)
})

7.零宽断言

在使用正则表达式时，捕获的内容前后必须是特定的内容，而我们又不想捕获这些特定内容的时候，零宽断言就可以派上用场了。

零宽度正预测先行断言 (?=exp)
零宽度负预测先行断言 (?!exp)
零宽度正回顾后发断言 (?<=exp)
零宽度负回顾后发断言 (?<!exp)

(?=exp) 这个简单理解就是说字符出现的位置的右边必须匹配到exp这个表达式。

var str = 'nodejs';
var reg = /node(?=js)/;
console.log(reg.test(str)) // true

(?!exp) 这个就是说字符出现的位置的右边不能是exp这个表达式。

var str = 'nodejs';
var reg = /node(?!js)/;
console.log(reg.test(str)) // false

(?<=exp) 这个就是说字符出现的位置的前边是exp这个表达式。

var str = '￥998$888';
var reg = /(?<=\$)\d+/;
console.log(reg.exec(str)) //888

(?<!exp) 这个就是说字符出现的位置的前边不能是exp这个表达式。

var str = '￥998$888';
var reg = /(?<!\$)\d+/;
console.log(reg.exec(str)) //998

?: 这个是什么意思？

(?:X)在正则中表示所匹配的子组X不作为结果输出
正常情况(X)中的X会被作为新增的一个组序号输出，比如(A)(B)，A的序号1,B的序号2
如果(?:A)(B)，A将没有序号不输出,B的序号为1

是不是对组序号有点懵？最后做个题。

Q:通过replace方法获取url中的参数的方法

练习题