正则表达式
• 介绍
• 语法
• 元字符
• 修饰符
• 目标:学习正则表达式概念及语法,编写简单的正则表达式实现字符的查找或检测。
1.1 什么是正则表达式
• 正则表达式(Regular Expression)是用于匹配字符串中字符组合的模式。在 JavaScript中,正则表达式也是对象
• 通常用来查找、替换那些符合正则表达式的文本,许多语言都支持正则表达式。
• 正则表达式在 JavaScript中的使用场景:
► 例如验证表单:用户名表单只能输入英文字母、数字或者下划线, 昵称输入框中可以输入中文(匹配)
► 比如用户名: /^[a-z0-9_-]{3,16}$/
► 过滤掉页面内容中的一些敏感词(替换),或从字符串中获取我们想要的特定部分(提取)等 。
1. 正则表达式是什么?
► 是用于匹配字符串中字符组合的模式
2. 正则表达式有什么作用?
► 过滤敏感词(替换)
► 字符串中提取我们想要的部分(提取)
1.2 语法
• 我们想要查找是否有戴眼镜的人, 怎么做呢?
1. 定义规则: 戴眼镜的
2. 根据规则去查找:找到则返回
• 正则同样道理,我们分为两步:
1. 定义规则
2. 查找
• 比如:查找下面文本中是否包含字符串 '前端'
• JavaScript 中定义正则表达式的语法有两种,我们先学习其中比较简单的方法:
• 1. 定义正则表达式语法:
• 比如:
- 其中 / / 是正则表达式字面量
- 比如:
2. 判断是否有符合规则的字符串:
test() 方法 用来查看正则表达式与指定的字符串是否匹配
• 语法:
- 如果正则表达式与指定的字符串匹配 ,返回true,否则false
1. 正则表达式使用分为几步?
► 定义正则表达式
► 检测查找是否匹配
2. 检索(查找)符合规则的字符串:
exec() 方法 在一个指定字符串中执行一个搜索匹配
• 语法:
- 如果匹配成功,exec() 方法返回一个数组,否则返回null
1. 正则表达式检测查找 test方法和exec方法有什么区别?
► test方法 用于判断是否有符合规则的字符串,返回的是布尔值 找到返回true,否则false
► exec方法用于检索(查找)符合规则的字符串,找到返回数组,否则为 null
1.3 元字符
目标:能说出什么是元字符以及它的好处
• 普通字符:
大多数的字符仅能够描述它们本身,这些字符称作普通字符,例如所有的字母和数字。也就是说普通字符只能够匹配字符串中与它们相同的字符。
• 元字符(特殊字符)
是一些具有特殊含义的字符,可以极大提高了灵活性和强大的匹配功能。
► 比如,规定用户只能输入英文26个英文字母,普通字符的话 abcdefghijklm…..
► 但是换成元字符写法: [a-z]
1. 什么是元字符以及它的好处是什么?
► 是一些具有特殊含义的字符,可以极大提高了灵活性和
► 比如英文26个英文字母,我们使用元字符 [a-z] 简介和灵活
为了方便记忆和学习,我们对众多的元字符进行了分类:
► 边界符(表示位置,开头和结尾,必须用什么开头,用什么结尾)
► 量词 (表示重复次数)
► 字符类 (比如 \d 表示 0~9)
1. 边界符
• 正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符
如果 ^ 和 $ 在一起,表示必须是精确匹配。
• 正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符
为了方便记忆和学习,我们对众多的元字符进行了分类:
► 边界符(表示位置,开头和结尾,必须用什么开头,用什么结尾)
► 量词 (表示重复次数)
► 字符类 (比如 \d 表示 0~9)
2. 量词
• 量词用来 设定某个模式出现的次数
注意: 逗号左右两侧千万不要出现空格
• 量词用来 设定某个模式出现的次数
+ 表示重复至少 1 次
* 表示重复 0 次或多次
{m, n} 表示复 m 到 n 次
为了方便记忆和学习,我们对众多的元字符进行了分类:
► 边界符(表示位置,开头和结尾,必须用什么开头,用什么结尾)
► 量词 (表示重复次数)
► 字符类 (比如 \d 表示 0~9)
3. 字符类:
(1) [ ] 匹配字符集合
• 后面的字符串只要包含 abc 中任意一个字符,都返回 true 。
(1) [ ] 里面加上 - 连字符
• 使用连字符 - 表示一个范围
►[a-z] 表示 a 到 z 26个英文字母都可以
► [a-zA-Z] 表示大小写都可以
► [0-9] 表示 0~9 的数字都可以
• 认识下:
(1) [ ] 里面加上 ^ 取反符号
• 比如:
► [^a-z] 匹配除了小写字母以外的字符
► 注意要写到中括号里面
(2) . 匹配除换行符之外的任何单个字符
1. 字符类 . (点)代表什么意思?
► 匹配除换行符之外的任何单个字符
2. 字符类 [] 有若干代表什么意思?
► [abc] 匹配abc其中的任何单个字符
► [a-z] 匹配26个小写英文字母其中的任何单个字符
► [^a-z] 匹配除了26个小写英文字母之外的其他任何单个字符
用户名验证案例
需求:用户名要求用户英文字母,数字,下划线或者短横线组成,并且用户名长度为 6~16位分析:
①:首先准备好这种正则表达式模式 /^[a-zA-Z0-9-_]{6,16}$/
②:当表单失去焦点就开始验证.
③:如果符合正则规范, 则让后面的span标签添加 right 类.
④:如果不符合正则规范, 则让后面的span标签添加 wrong 类.
• 昵称案例
需求:要求用户只能输入中文分析:
①:首先准备好这种正则表达式模式 /^[\u4e00-\u9fa5]{2,8}$/
②:当表单失去焦点就开始验证.
③:如果符合正则规范, 则让后面的span标签添加 right 类.
④:如果不符合正则规范, 则让后面的span标签添加 wrong 类.
• (3) 预定义:指的是 某些常见模式的简写方式。
4. 修饰符
• 目标:学习正则表达式概念及语法,编写简单的正则表达式实现字符的查找或检测。
• 修饰符约束正则执行的某些细节行为,如是否区分大小写、是否支持多行匹配等
• 语法:
► i 是单词 ignore 的缩写,正则匹配时字母不区分大小写
► g 是单词 global 的缩写,匹配所有满足正则表达式的结果
• 替换 replace 替换
• 语法:
过滤敏感字
需求:要求用户不能输入敏感字比如,pink老师上课很有**
分析:
①:用户输入内容
②:内容进行正则替换查找,找到敏感词,进行**
③:要全局替换使用修饰符 g