正则表达式

最新推荐文章于 2024-08-07 11:27:51 发布

原创最新推荐文章于 2024-08-07 11:27:51 发布 · 628 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#字符串 #正则表达式 #javascript

javascript 专栏收录该内容

5 篇文章

订阅专栏

本文主要介绍了正则表达式，它是一种字符串匹配模式，可用于检查、替换和提取子串。文中详细阐述了正则表达式的构造方法，包括元字符、运算符、修饰符、限定符、定位符等的使用，还介绍了JavaScript中RegExp对象的知识点，以及捕获表达式、选择、预查等内容。

正则表达式

首先，先说一下什么是正则表达式：正则表达式(regular expression)描述了一种字符串匹配的模式（pattern），可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。

符号	含义
+	+ 号代表前面的字符必须至少出现一次（1次或多次）
*	* 号代表前面的字符可以不出现，也可以出现一次或者多次（0次、或1次、或多次）
?	? 问号代表前面的字符最多只可以出现一次（0次、或1次）

构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与运算符可以将小的表达式结合在一起来创建更大的表达式。
1.匹配一段字符串，所有大写的字符

var str = 'aeiouQWEsrWWWrr';   //目标字符串
		var pattern = /[A-Z]/g;  //正则表达式
		console.log(str.match(pattern));

结果在控制台下显示的是：
在这里插入图片描述
在这里说明一下就是“g”这个符号是对符号进行全局匹配，如果不加"g"只返回一项符合要求的结果。

var str = 'aeiouQWEsrWWWrr';   //目标字符串
		var pattern = /[A-Z]/;  //正则表达式将/g去掉后看一下结果
		console.log(str.match(pattern));

在这里插入图片描述
这边说一下除g以外还其他类型的修饰符

符号	描述
i	执行对大小写不敏感的匹配。
g	执行全局匹配（查找所有匹配而非在找到第一个匹配后停止）。
m	执行多行匹配。

那如果我想将上面字符串中在一块儿的大写字母匹配出来，在表达式中加入“+”表示匹配符合要求的字符出现一次或多次。

	var str = 'aeiouQWEsrWWWrr';   //目标字符串
		var pattern = /[A-Z]+/g;  //正则表达式
		console.log(str.match(pattern));

在这里插入图片描述
2.匹配一个已知字符串中的其他字符，用符号“^”

		var str = 'aeiouQWEsrWWWrr';   //目标字符串
		var pattern = /[^aeiou]+/g;  //正则表达式
		console.log(str.match(pattern));

会匹配表达式中之外的所有字符
在这里插入图片描述
3.匹配字符串中出现的换行符、空白符用到了“\s”

		var str = 'aeiouQWEs\nrW  WWrr';   //目标字符串
		var pattern = /\s+/g;  //正则表达式
		console.log(str.match(pattern));

在这里插入图片描述
如果不想匹配字符中出现的换行符和空白符就用到“\S”,这边S是大写

        var str = 'aeiouQWEs\nrW  WWrr';   //目标字符串
		var pattern = /\S+/g;  //正则表达式
		console.log(str.match(pattern));

在这里插入图片描述
4.匹配一段字符串中所有的字母、数字、下划线用到了符号“\w”

	var str = 'aeiouQWEsrW_';   //目标字符串
		var pattern = /\w+/g;        //正则表达式
		console.log(str.match(pattern));

在这里插入图片描述
下面是一写非打印字符

符号	描述
\cx	匹配由x指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 ‘c’ 字符。
\f	匹配一个换页符。等价于 \x0c 和 \cL。
\n	匹配一个换行符。等价于 \x0a 和 \cJ。
\r	匹配一个回车符。等价于 \x0d 和 \cM。
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。注意 Unicode 正则表达式会匹配全角空格符
\S	匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\t	匹配一个制表符。等价于 \x09 和 \cI。
\v	匹配一个垂直制表符。等价于 \x0b 和 \cK。

限定符

符合	描述
{n}	n 是一个非负整数。匹配确定的 n 次。例如，‘o{2}’ 不能匹配 “Bob” 中的 ‘o’，但是能匹配 “food” 中的两个 o。
{n,}	n 是一个非负整数。至少匹配n 次。例如，‘o{2,}’ 不能匹配 “Bob” 中的 ‘o’，但能匹配 “foooood” 中的所有 o。‘o{1,}’ 等价于 ‘o+’。‘o{0,}’ 则等价于 ‘o*’。
{n,m}	m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。例如，“o{1,3}” 将匹配 “fooooood” 中的前三个 o。‘o{0,1}’ 等价于 ‘o?’。请注意在逗号和两个数之间不能有空格。

5.“{n}”可以指定匹配字符多少次这个值是固定的。

       var str = "1200923";
	    var pattern3 = /3{1}/g; 
		console.log(str.match(pattern3));

因为我规定的这个字符串中3出现的次数最多是一次。
在这里插入图片描述
如果我将{n}这里的数改一下，超过目标字符中字符出现的次数会有什么结果呢？

	var str = '1200923';   //目标字符串
		var pattern = /3{2}/;        //正则表达式
		console.log(str.match(pattern));

在这里插入图片描述
6."{n,}"这个表示匹配符合条件的出现的次数最少是n次，最多没有设置就表示这个数没有确定（多少都可以）

		var str = '1200923234567733';   //目标字符串
		var pattern = /3{1,}/g;        //正则表达式
		console.log(str.match(pattern));

在这里插入图片描述
7."{n,m}"这边是限制了匹配的字符最少出现的是n次最多出现的是m次

	var str = '1200923234567733';   //目标字符串
		var pattern = /3{1,1}/g;        //正则表达式
		console.log(str.match(pattern));

在这里插入图片描述
下面介绍的是定位符
先说一下定位符是用来做什么的，定位符使您能够将正则表达式固定到行首或行尾。它们还使您能够创建这样的正则表达式，这些正则表达式出现在一个单词内、在一个单词的开头或者一个单词的结尾。

定位符用来描述字符串或单词的边界，^ 和 $ 分别指字符串的开始与结束，\b 描述单词的前或后边界，\B 表示非单词边界

符号	描述
^	匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性，^ 还会与 \n 或 \r 之后的位置匹配。
$	匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性，$ 还会与 \n 或 \r 之前的位置匹配。
\b	匹配一个单词边界，即字与空格间的位置。
\B	非单词边界匹配。

这边再说·一下JavaScript中的RegExp的知识点

RegExp是对字符串执行的模式匹配的强大工具
直接量语法:

/pattern/attributes

创建 RegExp 对象的语法：

new RegExp(pattern, attributes);

参数
参数 pattern 是一个字符串，指定了正则表达式的模式或其他正则表达式。

参数 attributes 是一个可选的字符串，包含属性 “g”、“i” 和 “m”，分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前，不支持 m 属性。如果 pattern 是正则表达式，而不是字符串，则必须省略该参数。
8.匹配一段英文的单词用到了“\b”

		var str = 'This is a sentence , he has a big nose';   //目标字符串
		var pattern = /\bthis/ig;           //"\b"单词边界匹配指定字符并不区分大小写
		var pattern2  = /\bis/ig;           //"\b"
		console.log("pattern匹配模式的结果："+str.match(pattern));
		console.log("pattern2匹配模式下的结果："+str.match(pattern2));

在这里插入图片描述

		var str = "This is is a sentence he he has a big nose";   //目标字符串
		var pattern = /\bthis\b/ig;           //"\b"单词边界匹配指定字符并不区分大小写     
		var str2 = "Thisis is a sentence he he has a big nose";    //"\B"表示非单词边界这意味着要匹配的字符后面必须有值
		var pattern1 = /\bthis\B/ig;           
		var pattern2  = /\b([a-z]+) \1\b/ig; 
		console.log("pattern匹配模式的结果："+str.match(pattern));
	    console.log("pattern匹配模式的结果："+str2.match(pattern1));
		console.log("pattern2匹配模式下的结果："+str.match(pattern2));

在这里插入图片描述
捕获的表达式，正如 [a-z]+ 指定的，包括一个或多个字母。正则表达式的第二部分是对以前捕获的子匹配项的引用，即，单词的第二个匹配项正好由括号表达式匹配。\1 指定第一个子匹配项。
选择
用圆括号 () 将所有选择项括起来，相邻的选择项之间用 | 分隔。

() 表示捕获分组，() 会把每个分组里的匹配的值保存起来，多个匹配值可以通过数字 n 来查看(n 是一个数字，表示第 n 个捕获组的内容)。
8.下面是一个圆括号的应用

var str3 = "1234nihao4567nihao7890";
var pattern3 = /([1-9]{2,2})([a-z]+)/g;
console.log("pattern3匹配模式下的结果："+str3.match(pattern3));

在这里插入图片描述
但用圆括号会有一个副作用，使相关的匹配会被缓存，此时可用 ?: 放在第一个选项前来消除这种副作用。

符号	描述
?:	非捕获元素
?=	正向预查，在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜索字符串
?!	反向预查，在任何开始不匹配该正则表达式模式的位置来匹配搜索字符串

下面具体举个例子来了解一下"?="和”?!“这两个符号。

     //exp1(?=exp2)：查找 exp2 前面的 exp1。
	var str4 = "123456liudong67890liudong3456";
	var pattern4 = /liudong(?=\d)/g;    //"\d"表示[0-9]的数字
	console.log("pattern4匹配模式下的结果："+str4.match(pattern4));

“(?=)“表示正向预查，会先看括号内的条件”\d”(表示[0-9])在匹配指定的字符，看一下运行结果：
在这里插入图片描述
如果我把后面的数字去掉后后面那个字符串式匹配不到的

var str4 = "123456liudong67890liudong";
var pattern4 = /liudong(?=\d)/g;    //"\d"表示[0-9]的数字
console.log("pattern4匹配模式下的结果："+str4.match(pattern4));

在这里插入图片描述
相信通过这两者的对比就可以发现不同了。
再说一下"?<="

//(?<=exp2)exp1：查找 exp2 后面的 exp1。
var str4 = "123456liudong67890liudong12121";
var pattern5 = /(?<=liudong)\d+/g;
console.log("pattern5匹配模式下的结果："+str4.match(pattern5));

在这里插入图片描述
"?!"应用，匹配不满足圆括号内的指定字符。

//exp1(?!exp2)：查找后面不是 exp2 的 exp1。
var str4 = "123456liudong-67890liudong-12121";
var pattern6 = /liudong(?!\d+)/g;
console.log("pattern6匹配模式下的结果："+str4.match(pattern6));

在这里插入图片描述
"?<!"应用，匹配前面不是圆括号内的内容的字符。

//(?<!exp2)exp1：查找前面不是 exp2 的 exp1。
var str4 = "123456-liudong67890-liudong 12121";
var pattern7 = /(?<!\d+)liudong/g;
console.log("pattern7匹配模式下的结果："+str4.match(pattern7));