正则表达式

本文深入解析正则表达式的各个元素及其用法,并通过实例展示了如何在不同场景下运用正则表达式进行字符串匹配与操作。

From Unix Shell 编程 第七章

一、基本含义表

regular expression
^ 只只匹配行首
$ 只只匹配行尾
* 只一个单字符后紧跟*,匹配0个或多个此单字符
[ ] 只匹配[ ]内字符。可以是一个单字符,也可以是字符序列。可以使用 -
表示[ ]内字符序列范围,如用[1-5]代替[12345]
\ 只用来屏蔽一个元字符的特殊含义。因为有时在 shell中一些元字符有
特殊含义。\可以使其失去应有意义
. 只匹配任意单字符
pattern\{n\} 只用来匹配前面pattern出现次数。n为次数
pattern\{n,\} m 只含义同上,但次数最少为n
pattern\{n,m\} 只含义同上,但pattern出现次数在n与m之间


二、使用句点匹配单字符

如同DOS下面问号

. . . x . . x . . x

drwxrwxrw-  -no match
-rw-rw-rw-  -no match
-rwxrwxr-x  -match


三、 在行首以^匹配字符串或字符序列

^001,结果将匹配每行开始为001的字符串或单词:
1234XC9088 -no match
4523XX9001 -no match
0011XA9912 -match

^...4XC....
1234XC9008 -match
4523XX9001 -no match
0011XA9912 -no match


^...1 在行首第4个字符为1


^comp    行首前4个字符为comp


四、在行尾以$匹配字符串或字符

匹配以单词t r o u b l e结尾的所有行,操作为:
t r o u b l e $
使用1 d $返回每行以1 d结尾的所有字符串


如果要匹配所有空行,执行以下操作:^ $ 


如果只返回包含一个字符的行,操作如下:^.$


五、使用*匹配字符串中的单字符或其重复序列

(有点没太明白)

compu*t

computer
compuring
compuuuuute

10133*
101333
10133
101344444


六、 使用\屏蔽一个特殊字符的含义


就是转义符

需要转义符的字符有:

$.'"*[]^|()\+?



七、使用[]匹配一个范围或集合


使用[ ]匹配特定字符串或字符串集,可以用逗号将括弧内要匹配的不同字符串分开,但并不强制要求这样做(一些系统提倡在复杂的表达式中使用逗号) ,这样做可以增加模式的可读性。使用“-”表示一个字符串范围,表明字符串范围从“ -”左边字符开始,到“ -”右边字符结束。

[0123456789] 0-9之间的任意一个字符,或者[0-9]

[a-z] a到z

[ A - Z a - z ]

[ A - Z a - z 0 - 9 ]

s[a-z A-Z]t   s开头t结尾中间是字母

[ C c ] o m p u t e r

注意^符号的使用,当直接用在第一个括号里,意指否定或不匹配括号里内容。
[^a-zA-Z]
匹配任一非字母型字符,而
[ ^ 0 - 9 ]


八、使用\{\}匹配模式结果出现的次数

pattern\{n\}   匹配模式出现n次。
pattern\{n,\}   匹配模式出现最少n次。
pattern\{n,m}   匹配模式出现n到m次之间,n , m为0 - 2 5 5中任意整数

A \ { 2 \ } B
匹配值为A A B

如给出出现次数范围,例如A出现2次到4次之间:
A \ { 2 , 4 \ } B

前4个字符是数字,接下来是x x,最后4个也是数字,操作如下:
[ 0 - 9 ] \ { 4 \ }X X[ 0 - 9 ] \ { 4 \ }


九、一些例子

^ 对行首
$ 对行尾
^ [ t h e ] 对以t h e开头行
[ S s ] i g n a [ l L ] 对匹配单词s i g n a l、s i g n a L、
S i g n a l、S i g n a L
[Ss]igna[lL]\.  对同上,但加一句点
[ m a y M A Y ] 对包含m a y大写或小写字母的

^ U S E R $ 对只包含U S E R的行
[tty]$  对以t t y结尾的行
\ . 对带句点的行
^ d . . x . . x . . x 对对用户、用户组及其他用户组成员有可执行权限的目录
^ [ ^ l ] 对排除关联目录的目录列表
[ . * 0 ] 对0之前或之后加任意字符
[ 0 0 0 * ] 对0 0 0或更多个
[ iI] 对大写或小写I
[ i I ] [ n N ] 对大写或小写i或n
[ ^ $ ] 对空行

[ ^ . * $ ] 对匹配行中任意字符串
^ . . . . . . $ 对包括6个字符的行
[a- zA-Z] 对任意单字符
[ a - z ] [ a - z ] * 对至少一个小写字母
[ ^ 0 - 9 \ $ ] 对非数字或美元标识
[ ^ 0 - 0 A - Z a - z ] 对非数字或字母
[ 1 2 3 ] 对1到3中一个数字
[ D d ] e v i c e 对单词d e v i c e或D e v i c e
D e . . c e 对前两个字母为D e,后跟两个任意字符,最后为c e

\ ^ q 对以^ q开始行
^ . $ 对仅有一个字符的行
^\.[0-9][0-9]  对以一个句点和两个数字开始
的行
' " D e v i c e " ' 对单词d e v i c e
D e [ V v ] i c e \ . 对单词D e v i c e或d e v i c e
[ 0 - 9 ] \ { 2 \ } - [ 0 - 9 ] \ { 2 \ } - [ 0 - 9 ] \ { 4 \ } 对日期格式d d - m m - y y y y
[ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } 对I P地址格式nnn. nnn.nnn.nnn
[ ^ . * $ ] 对匹配任意行



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值