文章目录
JS正则表达式
匹配量词时需要添加^和$ 从开头到结尾,如果不加的话,只要匹配满足就不会在向后匹配
什么时候使用?
-
只要验证字符串格式或查找、屏蔽敏感词时都可以用正则
-
正则支持跨平台多语音,在每种语言中都有属于正则的对象,js中的正则对象为 RegExp 构造函数,一般会以简写的方式书写。
new RegExp('卧槽','ig').constructor === /卧槽/.constructor
正则书写格式
-
正则的书写格式:以双斜杠的形式书写 /正则表达式/ 下面是一个最简单的正则
const reg = /卧槽/
正则的简单测试
- 多个匹配条件时直接相连书写就行
const reg = /卧槽/
reg.test('卧槽,你家真大') // 如果匹配到了卧槽,则返回 true, 否则返回false
正则预定义字符集
-
某一位字符上可能有多种备选字时用: [备选字列表] 多个时用 | 分开
// 匹配字符串中是否包含 卧槽 或者 我日 const reg = /[卧槽|我日]/ reg.test('卧槽,你个老货,我日')
-
如果[]中部分字符是连续的,可用: [x-x]
// 配置字符串是否包含数字1到9和字母a到z或者A到Z组成 const reg = /[1-9a-zA-Z]/ reg.test('1aZ') // true reg.test('你好') // false
-
\d 匹配一位数字
-
\w 一位数字、字母或 _
-
\s 空格、tab、换行等空字符
-
| 多个正则只要命中一个皆可
-
. 任意字符
/\d/.test('1'); // true /\d/.test('a'); // false //>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> /\w/.test('1'); // true /\w/.test('aA'); // true /\w/.test('_'); // true /\w/.test('1aA_'); // true /\w/.test('你好'); // false //>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> /\s/.test(' ');// true /\s/.test(' a');//true /\s/.test('a');// false //>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> /^\d{2}$|^\d{5}$/.test('22');//true /^\d{2}$|^\d{5}$/.test('222');//false /^\d{2}$|^\d{5}$/.test('22212'); //true /^\d{2}$|^\d{5}$/.test('222121'); // false //>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> /./.test('ss dd 你好')
正则量词
- 如果规定一个字符集或子规则反复出现的次数时就用量词:
有明确数量边界的量词
-
匹配量词时需要添加^和$ 从开头到结尾,如果不加的话,只要匹配满足就不会在向后匹配
-
{n} =n 必须n个,不能多也不能少
-
{n,m} n个>= <=m个
-
{n,} n个>= 多了不限
/.{2}/.test('你好a'); // true 因为没有加^和$ 它只要匹配满足两位就不在向后匹配
/^.{2}$/.test('你好'); // true
/^.{2}$/.test('你好a'); // false
/^\d{3}$/.test('123'); // true
/^\d{3}$/.test('123'); // true
/^\d{3}$/.test('1234'); // true
//>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
/^\d{3,6}$/.test('1234'); // true
/^\d{3,6}$/.test('1234567'); // false
/^\d{3,6}$/.test('12'); // false
// >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
/^\d{3,}$/.test('1234444'); // true
/^\d{3,}$/.test('12'); // false
没有明确数量边界的量词
- * 可有可无,多了不限
- ? 0个或1个 可有可无,最多一个
- + 至少一个,多个不限
/\d*/.test('1'); // true
/\d*/.test(''); // true
//>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
/\d?/.test('');// true
/\d?/.test('1');// true
/^\d?$/.test('12');// false
//>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
/\d+/.test('');//false
/\d+/.test('111');//true
匹配特殊位置
- 字符串的开头位置: ^
- 字符串的结尾位置: $
- 英文句子中的单词的左右边界: \b
匹配中文
- [\u4e00-\u9fa5]
/[\u4e00-\u9fa5]/.test('你好');//true
/[\u4e00-\u9fa5]/.test('a');//false
/^[\u4e00-\u9fa5]{3}$/.test('你好你');//true
/^[\u4e00-\u9fa5]{3}$/.test('你好d你');//false
正则案例
- 匹配手机号,虽然基本上按现在的手机号码来说已经作用不大了,但是不影响
/^1[3-9]\d{9}$/.test('15985624120');// true
/^1[3-9]\d{9}$/.test('15985624122220');// false
/^1[3-9]\d{9}$/.test('1598562412s');// false
- 车牌号匹配
/^[\u4e00-\u9fa5][A-Z]·[A-Z0-9]{2}\d{3}$/.test('贵D·LV888');// true
/^[\u4e00-\u9fa5][A-Z]·[A-Z0-9]{2}\d{3}$/.test('贵D·LV88A');// false
- 匹配URL
/^http[s]?:\/\/.*/.test('https://');
- 匹配不能为负数
// 主要就是匹配第一位为数字的逻辑
/^(0|[1-9]\d*)(\.\d+)?$/.test('0.1')// true
String提供的正则相关函数
查找敏感词
-
str.indexOf(‘要匹配的字符’) 查找一个固定的敏感词出现的位置,只能找到固定的敏感词
'你好,卧槽'.indexOf('卧槽') // 返回下标 3 // 如果传入空字符会返回0
-
str.search(/正则/i) 用正则表达式模糊查找多种敏感词的出现的位置,可以查找多个
'你好,卧槽'.search(/你好|卧槽/) // 返回下标 3 没有找到就返回-1
-
str.match(/正则/i) 不加g,返回一个数组,包含敏感词和敏感词的下标和字符串本身,但是只能返回第一个匹配项
'你好,卧槽'.match(/卧槽/i) // ['卧槽', index: 3, input: '你好,卧槽', groups: undefined]
-
str.match(/正则/ig) 加g全局查找并返回多个敏感词,但是无法返回出现的位置
'你好,卧槽,你家真大。我日'.match(/卧槽|我日/ig) // ['卧槽', '我日'] var str="老师: 请用小红 我的 朋友造句。小亮:小红是我的朋友。小然:朋友!小红是我的!"; //希望找所有以小字开头的人名: var arr=str.match(/小[\u4e00-\u9fa5]/ig); // ['小红', '小亮', '小红', '小然', '小红']
替换敏感词
-
简单替换: 将所有敏感词都替换为统一的新值
str.replace(/正则/ig, “新值”)
var str="老师: 请用小红 我的 朋友造句。小亮:小红是我的朋友。小然:朋友!小红是我的!"; // 希望把所有以小字开头的人名都换成** str=str.replace(/小[\u4e00-\u9fa5]/ig,"**"); // '老师: 请用** 我的 朋友造句。**:**是我的朋友。**:朋友!**是我的!'
-
高级替换: 根据每次找到的敏感词不同,动态替换成不同的新值
str.replace(/正则/ig, function(keyword){ return 要替换的内容 }) ,没找到一个敏感词就会执行一次回调,返回的值会进行替换
// 将每个单词的首字母进行转大写 var str="you can you up"; str=str.replace(/\b[a-z]/ig,function(key){ return key.toUpperCase() }) // 'You Can You Up'
-
衍生操作: 删除敏感词: 只要把敏感词替换为""
var str="you can you up"; str=str.replace(/\b[a-z]/ig,function(key){ return '' }) // 'ou an ou p'
切割字符串
-
按指定符号切割字符串,并返回数组(字符串转数组)
str.split(“固定的切割符”);
'2654392501@qq.com'.split('@') // ['2654392501', 'qq.com'] '26543'.split('') // ['2', '6', '5', '4', '3']
-
衍生操作: 翻转一个字符串
var str="helloworld"; var arr=str.split(""); arr.reverse();//翻转 str=arr.join("");
RegExp对象
- js中专门保存一条正则表达式,并提供用正则表达式执行验证和查找功能的函数 的对象
- 正则表达式的语法是独立于任何变成语言之外的独立语法体系。js程序默认不认识正则表达式,所以,需要借助于一种特殊的对象来将正则表达式翻译为js程序认识的内容。
// new RegExp() === /\d/
/^\d$/.test('123'); // true
new RegExp(/\d/,'ig').test('123'); // true
test方法
-
用于验证正则和参数是否匹配,
-
坑: test()不要求要验证的字符串和正则完全匹配。只要能够在字符串内找到部分内容和正则匹配,就返回true!但是,通常我们格式验证时!都要求必须从头到尾都要和正则完全匹配才行!
-
解决: 今后只要验证格式,正则中都要同时前加^,后加$,表示从头到尾必须完全匹配的意思!
/^\d$/.test('123a'); // false
/^\d$/.test('123'); // true
exec方法
- 问题: match不加g时,虽然可以获得内容和位置,但是只能找第一个。match加g时,虽然可以找所有,但是无法获得敏感词的位置了。
- 解决: var arr=正则表达式对象.exec(“可能包含敏感词的字符串”)
- 问题: 正则表达式.exec()虽然一次只能查找一个敏感词,但是如果连续调用.exec()函数,它自己就知道找下一个!自动往下找!所以,.exec()经常配合循环一起使用!
- 强调: 要想让exec()能继续往下找下一个敏感词,则正则表达式必须加g。
- 返回值: 每次查找敏感词时,也都返回一个数组——同match不加g的情况
- 如果没找到,返回null
var str="老师:请用小红 我的 朋友造句。小亮:小红是我的朋友。小然:朋友!小红是我的!";
var reg=/小[\u4e00-\u9fa5]/g;
do{
var arr=reg.exec(str);
console.log(arr)
}while(arr!=null)
// 输出
['小红', index: 5, input: '老师:请用小红 我的 朋友造句。小亮:小红是我的朋友。小然:朋友!小红是我的!', groups: undefined]
['小亮', index: 16, input: '老师:请用小红 我的 朋友造句。小亮:小红是我的朋友。小然:朋友!小红是我的!', groups: undefined]
['小红', index: 19, input: '老师:请用小红 我的 朋友造句。小亮:小红是我的朋友。小然:朋友!小红是我的!', groups: undefined]
['小然', index: 27, input: '老师:请用小红 我的 朋友造句。小亮:小红是我的朋友。小然:朋友!小红是我的!', groups: undefined]
['小红', index: 33, input: '老师:请用小红 我的 朋友造句。小亮:小红是我的朋友。小然:朋友!小红是我的!', groups: undefined]
vscode正则插件推荐
- any-rule
- 安装成功后,在需要使用正则的地方右击鼠标>选择正则大全>选择需要的正则