目录
一、正则表达式
1、定义
通常用于判断语句中,用来检查某一字符串是否满足某一格式
正则表达式是由普通字符与元字符组成
普通字符包括大小写字母、数字、标点符号及一些其他符号
元字符是指在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符或表达式)在目标对象中的出现模式
2、正则表达式常见元字符
工具: grep、 egrep、 sed、 awk
2.1:\
:转义字符
用于取消特殊符号的含义例: \!、\n、\$
等
2.2:^
:匹配字符串开始的位置
^a、^the、^#、^[a-z]
2.3:$
:匹配字符串结束的位置
word$、^$匹配空行
2.4: .
:匹配除\n之外的任意的一个字符
go.d、 g..d
2.5:*
:匹配前面子表达式0次或者多次
goo*d、 go.*d
2.6:[list]
:匹配list列表中的一个字符
go[ola]d、[abc]、[a-z]、[a-z0-9]、[0-9]
匹配任意一位数字
2.7:[^list]
:匹配任意非list列表中的一个字符
[^0-9]、[^A-Z0-9]、[^a-z]
匹配任意一 位非小写字母
2.8:\{n\}
:匹配前面的子表达式n次
go\{2\}d、'[0-9]\{2\}'
匹配两位数字
2.9\{n,\}
:匹配前面的子表达式不少于n次
go\{2,\}d、'[0-9]\{2,\}'
匹配两位及两位以上数字
2.10:\{n,m\}:匹配前面的子表达式n到m次
go\{2,3\}d、'[0-9]\{2,3\}'
匹配两位到三位数字
注: egrep、awk使用{n}、{n,}、{n, m}匹配时“{}”前不用加“\”
-
\w
:匹配包括下划线的任何单词字符。 -
\W
:匹配任何非单词字符。等价于“[^A-8a-z0-9_ ]”。 -
\d
:匹配一个数字字符。 -
\D
:匹配一个非数字字符。等价于[^0-9]。 -
\s
:空白符。 -
\S
:非空白符
3. 正则表达式元字符的扩展
(支持的工具:egrep、awk)
、grep -E
、 sed -r
3.1:+
:匹配前面子表达式1次以上
go+d
将匹配至少一个o, 如god、good、goood等
3.2:?
匹配前面子表达式0次或者1次
go?d
将匹gd或god
3.3()
:将括号中的字符串作为一个整体
g(oo)+d
将匹配o整体1次以上,如good、gooood等
3.4:|
:以或的方式匹配字符串
g(oo|la)d
将匹配good或者gold
4、座机电话正则匹配
区号025开头,号码与区号间可以是空格、-、没有,号码必须是5或者8开头的八位数