js正则表达式
一、作用
1.验证数据的有效性
2.替换文本内容
3.从字符串中提取子字符串
例如:验证用户提交信息的正确性,如手机号、电子邮箱、身份证号等
二、语法
g: 全局匹配
i: 忽略大小写
gi: 全局匹配 + 忽略大小写
1.元字符
字符 | 描述 |
---|---|
^ | (以。。。开头)匹配输入字符串的开始位置,除非在方括号表达式中使用,当该符号在方括号表达式中使用时,表示不接受该方括号表达式中的字符集合。 |
$ | (以。。。结尾)匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 ‘\n’ 或 ‘\r’。 |
( ) | 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符,请使用 ( 和 )。 |
* | 匹配前面的子表达式零次或多次。 () {0,} |
+ | 匹配前面的子表达式一次或多次。(){1,} |
. | 匹配除换行符 \n 之外的任何单字符。 |
[ | 标记一个中括号表达式的开始。 |
? | 匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。 |
\ | 将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如, ‘n’ 匹配字符 ‘n’。’\n’ 匹配换行符。序列 ‘\’ 匹配 “”,而 ‘(’ 则匹配 “(”。 |
{ | 标记限定符表达式的开始。 |
| | 指明两项之间的一个选择。 |
2.字符集合
字符 | 描述 |
---|---|
[xyz] | 匹配中括号中任意字符,只匹配一个 [acd] |
[^xyz] | 匹配没有包含在中括号中的字符 [^123 |
- | -表示范围,如:所有小写字母[a-z] ,所有大写字母[A-Z],所有数字[0-9] [a-zA-Z0-9] |
3.预定义类
字符 | 说明 | 等价 |
---|---|---|
. | 匹配除了回车和换行之外的任何字符 | [^\n\r] |
\d | 匹配0-9之间任意一个数字 | [0-9] |
\D | 匹配除0-9之外任意字符 | [^0-9] |
\w | 匹配任意字母,数字和下划线 | [A-Za-z0-9_] |
\W | 匹配任意除字母,数字和下划线之外任意字符 | [^A-Za-z0-9_] |
\s | 匹配空格(换行符,制表符,空格符等) | [\t\r\n\v\f] |
\S | 匹配除空格之外任意字符 | [^\t\r\n\v\f] |
4.量词
字符 | 描述 |
---|---|
* | 匹配前面的子表达式零次或多次。例如,zo* 能匹配 “z” 以及 “zoo”。* 等价于{0,}。 |
+ | 匹配前面的子表达式一次或多次。例如,‘zo+’ 能匹配 “zo” 以及 “zoo”,但不能匹配 “z”。+ 等价于 {1,}。 |
? | 匹配前面的子表达式零次或一次。例如,“do(es)?” 可以匹配 “do” 、 “does” 中的 “does” 、 “doxy” 中的 “do” 。? 等价于 {0,1}。 |
{n} | n 是一个非负整数。匹配确定的 n 次。例如,‘o{2}’ 不能匹配 “Bob” 中的 ‘o’,但是能匹配 “food” 中的两个 o。 |
{n,} | n 是一个非负整数。至少匹配n 次。例如,‘o{2,}’ 不能匹配 “Bob” 中的 ‘o’,但能匹配 “foooood” 中的所有 o。‘o{1,}’ 等价于 ‘o+’。‘o{0,}’ 则等价于 ‘o*’。 |
{n,m} | m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,“o{1,3}” 将匹配 “fooooood” 中的前三个 o。‘o{0,1}’ 等价于 ‘o?’。请注意在逗号和两个数之间不能有空格。 |
5.边界
字符 | 说明 |
---|---|
^ | 输入开始 /^a/ 以a开头 |
$ | 输入结尾 /a$/ |
\b | 单词边界 |
\B | 非单词边界 |
三、正则表达式的创建
1. 字面量形式
let rel= /正则表达式/
2.正则对象
let rel2=new RegExp('正则表达式');
四、正则表达式的方法
1. test()
var src="talbe football,football,food";//需要验证的字符串
const reg=/foo/;//正则表达式
var result=reg.test(src);//验证字符串中是否包含foo
console.log(result);
2. exec();
匹配的文本,则返回一个结果数组。否则,返回 null。数组中的每个元素是字符串中每个匹配的文本
var src="talbe football,football,food"
var reg=/foo/g;
var result;
while((result=reg.exec(src))!==null){
console.log("匹配字符是:"+result+"下标是"+reg.lastIndex);
}
3.match();
var src="talbe football,football,food"
var reg=/foo/g;
var result=src.match(reg);
console.log(result);
4.search()
返回发生匹配的索引,没有匹配项返回-1
var src="talbe football,football,food"
var reg=/foo/g;
var result=src.search(reg);
console.log(result);
五、常用的正则
- Email地址:^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$
- 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
- InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+.)+[\w-]+(/[\w-./?%&=]*)?$
- 手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
- 电话号码(“XXX-XXXXXXX”、“XXXX-XXXXXXXX”、“XXX-XXXXXXX”、“XXX-XXXXXXXX”、"XXXXXXX"和"XXXXXXXX):^((\d{3,4}-)|\d{3.4}-)?\d{7,8}$
- 国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
- 身份证号(15位、18位数字):^\d{15}|\d{18}$
- 短身份证号码(数字、字母x结尾):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
- 帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):1[a-zA-Z0-9_]{4,15}$
- 密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):2\w{5,17}$
- 强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.\d)(?=.[a-z])(?=.*[A-Z]).{8,10}$
- 日期格式:^\d{4}-\d{1,2}-\d{1,2}
- 一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
- 一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
- xml文件:^([a-zA-Z]±?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]$
- 中文字符的正则表达式:[\u4e00-\u9fa5]
- 双字节字符:[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))
- 空白行的正则表达式:\n\s*\r (可以用来删除空白行)
- HTML标记的正则表达式:<(\S*?)[^>]>.?</\1>|<.*? /> (网上流传的版本太糟糕,上面这个也仅仅能部分,对于复杂的嵌套标记依旧无能为力)
- 首尾空白字符的正则表达式:^\s*|\s*KaTeX parse error: Undefined control sequence: \s at position 4: 或(^\̲s̲*)|(\s*) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)
- 腾讯QQ号:[1-9][0-9]{4,} (腾讯QQ号从10000开始)
- 中国邮政编码:[1-9]\d{5}(?!\d) (中国邮政编码为6位数字)
- IP地址:\d+.\d+.\d+.\d+ (提取IP地址时有用)
- IP地址:((?😦?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d))