正则表达式
来日方长,努力和期待终会相遇
文章目录
正则表达式概述
什么是正则表达式
正则表达式( Regular Expression **)**是用于匹配字符串中字符组合的模式。在 JavaScript中,正则表达式也 是对象
正则表通常被用来检索、替换那些符合某个模式(规则)的文本,例如验证表单:用户名表单只能输入英文字 母、数字或者下划线, 昵称输入框中可以输入中文(匹配)。此外,正则表达式还常用于过滤掉页面内容中的一 些敏感词(替换),或从字符串中获取我们想要的特定部分(提取)等 。
其他语言也会使用正则表达式,本阶段我们主要是利用 JavaScript 正则表达式完成表单验证。
正则表达式的特点
-
灵活性、逻辑性和功能性非常的强。
-
可以迅速地用极简单的方式达到字符串的复杂控制。
-
对于刚接触的人来说,比较晦涩难懂。比如: ^\w+([-+.]\w+)*@\w+([-.]\w+)*.\w+([-.]\w+)*$
-
实际开发,一般都是直接复制写好的正则表达式. 但是要求会使用正则表达式并且根据实际情况修改正则表达 式. 比如用户名: /1{3,16}$/
正则表达式在 JavaScript 中的使用
创建正则表达式
在 JavaScript 中,可以通过两种方式创建一个正则表达式。
1. 通过调用 RegExp 对象的构造函数创建
var 变量名 = new RegExp(/表达式/);
2. 通过字面量创建
var 变量名 = /表达式/;
// 中间放表达式就是正则字面量
测试正则表达式 test
test() 正则对象方法,用于检测字符串是否符合该规则,该对象会返回 true 或 false,其参数是测试字符串。
regexObj.test(str)
- regexObj 是写的正则表达式
- str 我们要测试的文本
- 就是检测str文本是否符合我们写的正则表达式规范
// 正则表达式在js中的使用
// 1. 利用 RegExp对象来创建 正则表达式
var regexp = new RegExp(/123/);
console.log(regexp); // /123/
// 2. 利用字面量创建 正则表达式
var rg = /123/;
// 3.test 方法用来检测字符串是否符合正则表达式要求的规范
console.log(rg.test(123)); //true
console.log(rg.test('12')); //false,一定要包含123这三个数
console.log(rg.test('456')); //false
console.log(rg.test('abc')); //false
正则表达式中的特殊字符
正则表达式的组成
一个正则表达式可以由简单的字符构成,比如 /abc/,也可以是简单和特殊字符的组合,比如 /ab*c/ 。其中
特殊字符也被称为元字符,在正则表达式中是具有特殊意义的专用符号,如 ^ 、$ 、+ 等。
特殊字符非常多,可以参考:
-
MDN:https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Guide/Regular_Expressions
-
jQuery 手册:正则表达式部分
-
正则测试工具: http://tool.oschina.net/regex
这里我们把元字符划分几类学习
边界符
正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符
如果 ^ 和 $ 在一起,表示必须是精确匹配
字符类
字符类表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内。
- [] 方括号
/[abc]/.test('andy') // true
后面的字符串只要包含 abc 中任意一个字符,都返回 true
但是如果为/2$/,只能为a,b,c其中一个才符合,有其它字符都会返回false
因为/^abc$/一定要abc才符合,那么[abc]是任意一个字符,精准匹配之后(也可以说是要一模一样),一定要a,b,c其中一个才能可以
- [-] 方括号内部 范围符-
/^[a-z]$/.test('c') // true
方括号内部加上 - 表示范围,这里表示 a 到 z 的26个英文字母都可以
- [^] 方括号内部 取反符^
/[^abc]/.test('andy') // false
方括号内部加上 ^ 表示取反,只要包含方括号内的字符,都返回 false 。
注意和边界符 ^ 区别,边界符写到方括号外面。
- 字符组合
/[a-z1-9]/.test('andy') // true
方括号内部可以使用字符组合,这里表示包含 a 到 z 的26个英文字母和 1 到 9 的数字都可以
小练习
<script>
//var rg = /abc/; 只要包含abc就可以
// 字符类: [] 表示有一系列字符可供选择,只要匹配其中一个就可以了
var rg = /[abc]/;
// 只要包含有a 或者 包含有b 或者包含有c 都返回为true
console.log(rg.test('andy'));//true
console.log(rg.test('baby'));//true
console.log(rg.test('color'));//true
console.log(rg.test('red'));//false
console.log('------------------');
var rg1 = /^[abc]$/;
// 三选一 只有是a 或者是 b 或者是c 这三个字母才返回 true
console.log(rg1.test('aa'));//false
console.log(rg1.test('a'));//true
console.log(rg1.test('b'));//true
console.log(rg1.test('c'));//true
console.log(rg1.test('abc'));//false
console.log('------------------');
var reg = /^[a-z]$/;
// 26个英文字母任何一个字母都返回true
// - 表示的是a 到z 的范围
console.log(reg.test('a'));//true
console.log(reg.test('z'));//true
console.log(reg.test(1));//false
console.log(reg.test('A'));//false
console.log(rg.test('aa'));//false
console.log('------------------');
// 字符组合
var reg1 = /^[a-zA-Z0-9_-]$/;
// 26个英文字母(大写和小写都可以)任何一个字母返回 true
console.log(reg1.test('a'));//true
console.log(reg1.test('B'));//true
console.log(reg1.test(8));//true
console.log(reg1.test('-'));//true
console.log(reg1.test('_'));//true
console.log(reg1.test('!'));//false
console.log('----------------');
// 如果中括号里面有^表示取反的意思,千万不要和我们边界符 ^ 别混淆
var reg2 = /^[^a-zA-Z0-9_-]$/;
console.log(reg2.test('a'));//false
console.log(reg2.test('B'));//false
console.log(reg2.test(8));//false
console.log(reg2.test('-'));//false
console.log(reg2.test('_'));//false
console.log(reg2.test('!'));//true
</script>
量词符
量词符用来设定某个模式出现的次数。
<script>
// 量词符: 用来设定某个模式出现的次数
// 简单理解: 就是让下面的a这个字符重复多少次
// * 相当于 >= 0 可以出现0次或者很多次
// var reg = /^a*$/;
// console.log(reg.test(''));//true
// console.log(reg.test('a'));//true
// console.log(reg.test('aaaa'));//true
// + 相当于 >= 1 可以出现1次或者很多次
// var reg = /^a+$/;
// console.log(reg.test('')); // false
// console.log(reg.test('a')); // true
// console.log(reg.test('aaaa')); // true
// ? 相当于 1 || 0
// var reg = /^a?$/;
// console.log(reg.test('')); // true
// console.log(reg.test('a')); // true
// console.log(reg.test('aaaa')); // false
// {3} 就是重复3次
// var reg = /^a{3}$/;
// console.log(reg.test('')); // false
// console.log(reg.test('a')); // false
// console.log(reg.test('aaaa')); // false
// console.log(reg.test('aaa')); // true
// {3, } 大于等于3
var reg = /^a{3,}$/;
console.log(reg.test('')); // false
console.log(reg.test('a')); // false
console.log(reg.test('aaaa')); // true
console.log(reg.test('aaa')); // true
// {3,16} 大于等于3 并且 小于等于16
var reg = /^a{3,6}$/;
console.log(reg.test('')); // false
console.log(reg.test('a')); // false
console.log(reg.test('aaaa')); // true
console.log(reg.test('aaa')); // true
console.log(reg.test('aaaaaaa')); // false
</script>
括号总结
-
大括号 量词符. 里面表示重复次数
-
中括号 字符集合。匹配方括号中的任意字符.
-
小括号 表示优先级
可以在线测试:https://tool.oschina.net/regex#
预定义类
预定义类指的是某些常见模式的简写方式
<script>
// 座机号码验证: 全国座机号码
//两种格式: 010-12345678 或者 0530-1234567
// 正则里面的或者 符号 |
// var reg = /^\d{3}-\d{8}|\d{4}-\d{7}$/;
var reg = /^\d{3,4}-\d{7,8}$/;
</script>
特殊字符
字符 | 含义 |
---|---|
\ | 转义字符,/[a-z]\s/ 和 new RegExp("[a-z]\\s") 创建了相同的正则表达式 |
[\b] | 匹配一个退格 (U+0008) |
\n | 换行符 |
\r | 回车符 |
\0 | 匹配NULL(U+0000)字符, 不要在这后面跟其它小数,因为 \0<digits> 是一个八进制转义序列 |
\xhh | 匹配一个两位十六进制数(\x00-\xFF)表示的字符 |
正则表达式参数
/表达式/[switch]
switch(也称为修饰符) 按照什么样的模式来匹配. 有三种值:
-
g:全局匹配
-
i:忽略大小写
-
gi:全局匹配 + 忽略大小写
<textarea name="" id="" cols="30" rows="10"></textarea>
<button>提交</button>
<div></div>
<script>
var btn = document.querySelector('button');
var text = document.querySelector('textarea');
var div = document.querySelector('div');
btn.addEventListener('click', function() {
var reg = /敬请|精确/g;
div.innerHTML = text.value.replace(reg, '**');
})
</script>
常用的正则表达式
//匹配中文字符
/[\u4e00-\u9fa5]/
//匹配空白行
/\n\s*\r/
//匹配邮箱地址
/^[a-zA-Z0-9]+([-_.][A-Za-zd]+)*@([a-zA-Z0-9]+[-.])+[A-Za-zd]{2,5}$/
//匹配网址
/[a-zA-z]+://[^\s]*/
//匹配腾讯号码
/[1-9][0-9]{4,}/
//匹配中国邮政编码
/[1-9]\d{5}(?!\d)/
//匹配手机号码
/^1[34578][0-9]{9}$/
正则表达式中的方法
replace 替换
replace() 方法可以实现替换字符串操作,用来替换的参数可以是一个字符串或是一个正则表达式
stringObject.replace(*regexp/substr*,*replacement*)
- 第一个参数: 被替换的字符串 或者 正则表达式
- 第二个参数: 替换为的字符串
- 返回值是一个替换完毕的新字符串
// 替换 replace
var str = 'andy和red';
var newStr = str.replace('andy','baby');//baby
var newStr = str.replace(/andy/,'baby');
//这一个功能就可以把一些用户输入的敏感词
//转化为**等等这种被遮盖的符号
exec匹配
exec()
方法在一个指定字符串中执行一个搜索匹配。返回一个结果数组或 null
var myArray = /d(b+)d/g.exec("cdbbdbsbz");
console.log(myArray);
var myRe = new RegExp("d(b+)d", "g");
var myArray1 = myRe.exec("iiouiio");
console.log(myArray1);
当你想要知道在一个字符串中的一个匹配是否被找到,你可以使用 test 或 search 方法;
想得到更多的信息(但是比较慢)则可以使用 exec 或 match 方法。
如果你使用 exec 或 match 方法并且匹配成功了,那么这些方法将返回一个数组并且更新相关的正则表达式对象的属性和预定义的正则表达式对象。如果匹配失败,那么 exec 方法返回 null(也就是 false)。
match匹配
一个在字符串中执行查找匹配的 String 方法,它返回一个数组,在未匹配到时会返回 null
const paragraph = 'The quick brown fox jumps over the lazy dog. It barked.';
const regex = /[A-Z]/g;
const found = paragraph.match(regex);
console.log(found);
split分割
一个使用正则表达式或者一个固定字符串分隔一个字符串,并将分隔后的子字符串存储到数组中的 String
方法
const str = 'The quick brown fox jumps over the lazy dog.';
const words = str.split(' ');
console.log(words);
console.log(words[3]);
search搜索
一个在字符串中测试匹配的 String 方法,它返回匹配到的位置索引,或者在失败时返回-1
const paragraph = '. If the dog barked, was it really lazy ?';
// any character that is not a word character or whitespace
const regex = /[^\w\s]/g;
console.log(paragraph.search(regex));//0