是一些特殊或不很特殊的字符串模式的集合。
可以实现从一个文件或命令输出中抽取或过滤文本。
基本元字符集及其含义
^ 只匹配行首
$ 只匹配行尾
* 一个单字符后紧跟*,匹配0个或多个此单字符
[ ] 匹配[ ]内字符。可以是一个单字符,也可以是字符序列。可以使用-表示[ ]内字符序列范围,如用[ 1 - 5 ]代替[ 1 2 3 4 5 ]
\ 用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有特殊含义。\可以使其失去应有意义
. 匹配任意单字符
pattern\{n\} 用来匹配前面pattern出现次数。n为次数
pattern\{n,\}m 含义同上,但次数最少为n
pattern\{n,m\} 含义同上,但p a t t e r n出现次数在n与m之间
1、句点.
作用:可以匹配任意单字符
例:
1)匹配以Beg开头,以n结尾,中间夹一个字符,写成Beg.n
2)匹配一定的权限
ls -l | grep ...x..x..x
2、^
^作用:在行首匹配字符串或字符序列
例:注意下面两个匹配的情况,其实很清楚了,行首是说输出来的最左边那个。
# ls | grep ^d
dir
# ls -l | grep ^d
drwxr-xr-x 2 root root 4096 Apr 4 20:52 control
3、$
$作用:与^相反,匹配行尾字符,放的位置也在后面
例:匹配以ld结尾的 ld$
匹配所有空行
^ $
匹配包含一个字符的行
^ . $
4、\
\作用:屏蔽一个特殊字符的含义
特殊字符:$ . ' " [] ^ | () \ + ?
例:匹配以*.pas结尾的所有文件
\*\.pas
5、[]
[]作用:匹配一个范围或集合
用逗号将括弧内要匹配的不同字符串分开
-”表示一个字符串范围,表明字符串范围从“ -”左边字符开始,到“ -”右边字
符结束。
匹配任意小写字母[a-z]
匹配任意字母[A-Za-z]
匹配任意字母或数字[A-Za-z0-9]
匹配Computer或computer两个单词:
[Cc]omputer
注意^符号的使用,当直接用在第一个括号里,意指否定或不匹配括号里内容。
[^a-zA-Z] 匹配任一非字母型字符
[^0-9] 匹配任一非数字型字符。
6、\{\}
\{\}作用:匹配模式结果出现的次数
三种模式:
pattern\{n\} 匹配模式出现n次。
pattern\{n,\} 匹配模式出现最少n次。
pattern\{n,m} 匹配模式出现n到m次之间,n, m为0-255中任意整数。
例:[0-9]\{4\}X X[0-9]\{4\}
具体含义如下:
1) 匹配数字出现4次。
2) 后跟代码x x。
3) 最后是数字出现4次。
7、经常使用的正则表达式举例
^ 行首
$ 行尾
^[the] 以the开头行
[Ss]igna[lL] 匹配单词signal、signaL、Signal、SignaL
[Ss]igna[lL]\. 同上,但加一句点
[mayMAY] 包含may大写或小写字母的行
^USER$ 包含USER的行
[tty]$ 以tty结尾的行
\. 带句点的行
^d..x..x..x 用户、用户组及其他用户组成员有可执行权限的目录
^[^l] 排除关联目录的目录列表
[.*0] 0之前或之后加任意字符
[000*] 000或更多个
[iI] 大写或小写I
[iI][nN] 大写或小写i或n
[^$] 空行
[^.*$] 匹配行中任意字符串
^......$ 包括6个字符的行
[a-zA-Z] 任意单字符
[a-z][a-z]* 至少一个小写字母
[^0-9\$] 非数字或美元标识
[^0-9A-Za-z] 非数字或字母
[123] 1到3中一个数字
[Dd]evice 单词device或Device
De..ce 前两个字母为D e,后跟两个任意字符,最后为c e
\^q 以^q开始行
^.$ 仅有一个字符的行
^\.[0-9][0-9] 以一个句点和两个数字开始的行
'"Device"' 单词device
De[Vv]ice\. 单词Device.或device.
[0-9]\{2\}-[0-9]\{2\}-[0-9]\{4\} 日期格式dd-mm-yyyy
[0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\} IP地址格式nnn. nnn.nnn.nnn
[^.*$] 匹配任意行
可以实现从一个文件或命令输出中抽取或过滤文本。
基本元字符集及其含义
^ 只匹配行首
$ 只匹配行尾
* 一个单字符后紧跟*,匹配0个或多个此单字符
[ ] 匹配[ ]内字符。可以是一个单字符,也可以是字符序列。可以使用-表示[ ]内字符序列范围,如用[ 1 - 5 ]代替[ 1 2 3 4 5 ]
\ 用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有特殊含义。\可以使其失去应有意义
. 匹配任意单字符
pattern\{n\} 用来匹配前面pattern出现次数。n为次数
pattern\{n,\}m 含义同上,但次数最少为n
pattern\{n,m\} 含义同上,但p a t t e r n出现次数在n与m之间
1、句点.
作用:可以匹配任意单字符
例:
1)匹配以Beg开头,以n结尾,中间夹一个字符,写成Beg.n
2)匹配一定的权限
ls -l | grep ...x..x..x
2、^
^作用:在行首匹配字符串或字符序列
例:注意下面两个匹配的情况,其实很清楚了,行首是说输出来的最左边那个。
# ls | grep ^d
dir
# ls -l | grep ^d
drwxr-xr-x 2 root root 4096 Apr 4 20:52 control
3、$
$作用:与^相反,匹配行尾字符,放的位置也在后面
例:匹配以ld结尾的 ld$
匹配所有空行
^ $
匹配包含一个字符的行
^ . $
4、\
\作用:屏蔽一个特殊字符的含义
特殊字符:$ . ' " [] ^ | () \ + ?
例:匹配以*.pas结尾的所有文件
\*\.pas
5、[]
[]作用:匹配一个范围或集合
用逗号将括弧内要匹配的不同字符串分开
-”表示一个字符串范围,表明字符串范围从“ -”左边字符开始,到“ -”右边字
符结束。
匹配任意小写字母[a-z]
匹配任意字母[A-Za-z]
匹配任意字母或数字[A-Za-z0-9]
匹配Computer或computer两个单词:
[Cc]omputer
注意^符号的使用,当直接用在第一个括号里,意指否定或不匹配括号里内容。
[^a-zA-Z] 匹配任一非字母型字符
[^0-9] 匹配任一非数字型字符。
6、\{\}
\{\}作用:匹配模式结果出现的次数
三种模式:
pattern\{n\} 匹配模式出现n次。
pattern\{n,\} 匹配模式出现最少n次。
pattern\{n,m} 匹配模式出现n到m次之间,n, m为0-255中任意整数。
例:[0-9]\{4\}X X[0-9]\{4\}
具体含义如下:
1) 匹配数字出现4次。
2) 后跟代码x x。
3) 最后是数字出现4次。
7、经常使用的正则表达式举例
^ 行首
$ 行尾
^[the] 以the开头行
[Ss]igna[lL] 匹配单词signal、signaL、Signal、SignaL
[Ss]igna[lL]\. 同上,但加一句点
[mayMAY] 包含may大写或小写字母的行
^USER$ 包含USER的行
[tty]$ 以tty结尾的行
\. 带句点的行
^d..x..x..x 用户、用户组及其他用户组成员有可执行权限的目录
^[^l] 排除关联目录的目录列表
[.*0] 0之前或之后加任意字符
[000*] 000或更多个
[iI] 大写或小写I
[iI][nN] 大写或小写i或n
[^$] 空行
[^.*$] 匹配行中任意字符串
^......$ 包括6个字符的行
[a-zA-Z] 任意单字符
[a-z][a-z]* 至少一个小写字母
[^0-9\$] 非数字或美元标识
[^0-9A-Za-z] 非数字或字母
[123] 1到3中一个数字
[Dd]evice 单词device或Device
De..ce 前两个字母为D e,后跟两个任意字符,最后为c e
\^q 以^q开始行
^.$ 仅有一个字符的行
^\.[0-9][0-9] 以一个句点和两个数字开始的行
'"Device"' 单词device
De[Vv]ice\. 单词Device.或device.
[0-9]\{2\}-[0-9]\{2\}-[0-9]\{4\} 日期格式dd-mm-yyyy
[0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\}\.[0-9]\{3\} IP地址格式nnn. nnn.nnn.nnn
[^.*$] 匹配任意行