1. 正则的功能
- 校验数据有效性
- 查找符合要求的文本内容
- 对文本进行切割,替换等操作
2. 元字符的概念
元字符就是指那些在正则表达式中具有特殊意义的专用字符,元字符是构成正则表达式的基本元件。正则就是由一系列的元字符组成的。
3.元字符的分类与记忆技巧
正则元字符可以分为这几类:表示特殊单字符的,表示空白符的,表示某个范围的,表示次数的量词,另外还有表示断言的,我们可以把它理解成边界限定。
3.1 特殊单字符
- . 任意字符 (换行除外)
- \d 任意数字 \D 任意非数字
- \w 任意数字字母下划线 \W 任意非数字字母下划线
- \s 任意空白符 \S 任意空白符
- ^ 不在[]里面时表示字符串开始位置,例如:^abc,表示以abc为开头
- $ 字符串结束位置
3.2 空白符
- \r 回车符
- \n换行符
- \f 换页符
- \t 制表符
- \v垂直制表符
- \s任意空白符
3.3 量词
- * 0到多次
- + 1到多次
- ? 0到1次
- {m} 出现m次
- {m,} 出现至少m次
- {m,n} m到n次
3.4 范围
- | 或,如:ab|bc为ab或bc
- […] 多选一,括号中任意单个元素
- 如:[abc]表示a或b或c
- [a-z] 表示小写a到z之间任意单个元素
- [^…] 取反,不能是括号中的任意单个元素