正则表达式,又称规则表达式。
正则表达式:是一个描述字符模式的对象,ECMAScript的RegExp类表示正则表达式。而string和RegExp都定义了使用正则表达式进行强大的模式匹配和文本检索与替换的函数
查找、替换,通常用作验证,截取,隐藏,编码
一 : 正则表达式的创建方式
1: 字面量创建方式 语法: var reg = /正则表达式/修饰符
修饰符:
1: g 全局查找
2: i 不区分大小写
3: m 多行匹配
定义正则表达式有两种形式:
构造函数方式: new RegExp(pattern, attributes);
例:var reg=new RegExp(“abc",“g”);
构造函数中的正则可以是常量字符串或一个JS变量,使用元字符需要转义
pattern 为一个字符串或匹配规则
attributes 为可选字符串,包含属性g、i 和 m
g:代表全局匹配 (继续往下匹配) global
i:代表不区分大小写匹配
m:代表多行匹配,只对^和$模式有用
普通方式: /pattern/attributes(/正则/属性)
例:var reg=/abc/g;
普通方式中的正则必须是一个常量字符串
正则的索引
每个正则表达式都有一个 lastIndex 属性,用于记录上一次匹配结束的位置(索引值)。
获取:reg.lastIndex; 设置:reg.lastIndex=0;
示例:(test:方法检索字符串中指定的值 返回 true 或 false)
var str=‘abcdeabfg’;
var reg=new RegExp(‘ab’,‘g’);
alert(reg.test(str));
alert(reg.lastIndex);
alert(reg.test(str));
alert(reg.lastIndex);
元字符
\d : 匹配任意一个数字,0~9 中的任意一个。
\s : 匹配任意一个空白字符。
\b : 匹配一个单词边界,不匹配任何字符。
\w : 匹配任意一个字符( 字母、 数字、下划线 )。
. : 匹配任意一个字符,除了换行符( \n )。
\n : 查找换行符。
\u : 通常用来匹配汉字。
表达式 “\d”,“\s”,“\b”,“\w”,对应的大写字母表示相反的意义。
如:\D 匹配所有的非数字字符(反选)。
/^(?=\D+\d)(?=.*[a-z])(?=.*[A-Z])[a-zA-Z0-9]{8,16}$/
- (?=\D+\d) 条件是首字母不能是数字,但是整个字符串中必须含有1个数字
- (?=.*[a-z]) 必须包含一个小写字母,字母可以在任意位置
- (?=.*[A-Z]) 必须包含一个大写字母,字母可以在任意位置
- [a-zA-Z0-9]{8,16} 大小写字母和数字字符最少8个,最多个16
方括号
[abc] : 查找方括号之间的任何一个字符。
[^abc] : 查找任何不在方括号之间的字符(反选)。
[0-9] : 查找任何从 0 至 9 的数字。
[a-z] : 查找任何从小写 a 到小写 z 的字符。
[A-Z] : 查找任何从大写 A 到大写 Z的字符。
量词
n+ : 匹配任何包含至少一个 n 的字符串。{1,}
n? : 匹配任何包含零个或一个 n 的字符串。{0,1}
n* : 匹配任何包含零个或多个 n 的字符串。{0,}
n{X} : 匹配包含 X 个 n 的序列的字符串。
n{X,Y} : 匹配包含 X 到Y 个 n 的序列的字符串。
^n : 匹配任何开头为 n 的字符串。
n$ : 匹配任何结尾为 n 的字符串。
其他
| : 匹配左边或者右边
\ : 转义符
特殊标点符号,在前面加 \ 后,就代表该符号本身
^ 要匹配 "^" 字符本身,请使用 \^
( ) 要匹配小括号本身,请使用 \( 和 \)
其他特殊标点符号 [ ] { } . ? + * |
Unicode编码16进制的utf-8汉字编码:
4e00最小中文字符 9fa5最大中文字符
/[\u4e00-\u9fa5]+/ 常用汉字编码范围
var reg=/[\u4e00-\u9fa5]+/g; //匹配汉字
var str='123jlkj她637skfjkdd';
console.log(reg.test(str));
RegExp.$1 访问分组匹配的内容
$1是RegExp对象的一个属性,指的是正则表达式匹配到的第一个子串(以括号为标志)
依次类推,还有RegExp.$1,RegExp.$2,RegExp.$3 ...... 可以有99个匹配
var reg = /^(\d{4})-(\d{1,2})-(\d{1,2})$/; // 小括号分组
reg.exec('2020-5-30')
console.log(RegExp.$1) // 2020
console.log(RegExp.$2) // 5
console.log(RegExp.$3) // 30
RegExp对象会在正则匹配后,自动将最近一次结果保存起来
正则对象方法
test:检索字符串中指定的值 返回 true 或 false
reg.test(str);
exec: 检索字符串返回查找结果的第一个值
reg.exec(str);
compile: 该方法可以重编辑指定的正则表达式
var num='13520006789';
var reg=/13[4-9]\d{8}/g;
console.log(reg.test(num));
reg.compile('13[0-3][0-9]{8}','g');//修改正则
console.log(reg.test(num));//false
String对象方法
search:检索与正则表达式相匹配的值
用法:str.search(reg); (返回索引值,无-1)
match:返回所有正则表达式的匹配(加g)
用法:str.match(reg); (返回数组)
replace:替换与正则表达式匹配的子串
用法:str.replace(reg,“”); 返回替换之后的内容
split:将字符串匹配的部分做分割(去除)
用法:str.split(reg); (返回数组)
过滤HTML标签
尖括号里是除了尖括号之外其他字符 /<[^<>]+>/g
匹配邮政编码
开头非0的6位数字 /^[1-9]\d{5}$/
文件格式检测
文件格式结尾为 .格式
/\.(png|jpe?g|gif)$/
/\.(mp4|webm|ogg|mp3|wav)$/
手机号
/^(1|\+861)[3-8]{1}\d{9}$/
身份证
身份证号码为15位或者18位,15位为全数字,18位前17位为数字,最后一位是校验位,可能为数字或字符X
/(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)/
中文检测
/[\u4e00-\u9fa5]+/g
QQ号验证
/^[1-9]\d{4,10}$/
座机号码
010-86123456-2345
023-67622000-02
0755-66608483
开头为0,后面是2或三位数字加上 - 开头为非零的八位数字,结尾是 - 加1到4位数字的分机号
(0\d{2,3}-)?[1-9]\d{7}(-\d{1,4})?
邮件格式
简单验证 /^\w+@[a-z0-9]+\.[a-z]+$/
具体验证 /^\w{2,18}@[0-9a-z]{1,10}(\.[a-z]{2,3}){1,2}$/
删除多余空格
str.replace(/\s+/,'');
删除首尾空格
str.replace(/^\s+/,'');
str.replace(/\s+$/,'');