元字符:描述字符的字符
正则表达式:是由一串字符和元字符构成的字符串,简称RE(regular expression)
正则表达式主要功能:文本查询、字符串操作,它可以匹配文本的一个字符或字符集合
基本正则表达式元字符集合及其意义
* 表示重复前面单个字符0次或多次
. 匹配任意字符
^ 匹配行首,或后面字符的非
$ 匹配行尾
[] 匹配字符集合
\ 转义符,屏蔽一个元字符的特殊含义,元字符变为普通字符
\<\> 精确匹配符号
\{n\} 匹配前面字符出现n次
\{n,\} 匹配前面字符至少出现n次
\{n,m\} 匹配前面字符出现n-m次
^放到[]中不再表示行首,而表示取反
[^b-d] 表示匹配不在b-d内的任意字符
\<the\> 只精确匹配the这个单词
\{\}和*作用类似,都表示前一个字符重复次数,但是,*表示重复任意次,而\{\}表示重复指定次数
例如:[a-z] \{5\} 表示精确匹配5个小写字母
正则表达式扩展元字符
? 匹配前面单个字符0次或1次
+ 匹配前面单个字符1次或多次
() 表示一个字符集合
| 表示或,匹配一组可选的字符
POSIX字符类
[:upper:] 表示大写字母[A-z]
[:lower:] 表示小写字母[a-z]
[:digit:] 表示阿拉伯数字[0-9]
[:alnum:] 表示大小写字母和阿拉伯数字[0-9 a-z A-Z]
[:alpha:] 表示大小写字母[a-z A-Z]
[:space:] 表示空格或tab键
[:cntrl:] 表示ctrl键
[:graph:]或[:print:] 表示ASCII码33-126之间的字符
[:xdigit:] 表示16进制数