正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写regex、regexp或RE),计算机科学的一个概念。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。
正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。。
给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);
2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。
正则表达式的特点是:
1. 灵活性、逻辑性和功能性非常的强;
2. 可以迅速地用极简单的方式达到字符串的复杂控制。
3. 对于刚接触的人来说,比较晦涩难懂。
由于正则表达式主要应用对象是文本,因此它在各种文本编辑器场合都有应用,小到著名编辑器EditPlus,大到Microsoft Word、Visual Studio等大型编辑器,都可以使用正则表达式来处理文本内容。
grep
参数 | 释义 |
---|---|
n | 显示行号 |
o | 只显示匹配内容 |
q | 静默模式,无任何输出 |
$? | 配合上面‘q’来判断执行成功没有,即有没有过滤到想要的内容 |
l | 如果匹配成功,只打印文件名,失败则不打印 |
r | ‘r’通常rl一起用 |
A | 如果匹配成功,则将匹配行及其后n行一起打印出来 |
B | 如果匹配成功,则将匹配行及其前n行一起打印出来 |
C | 如果匹配成功,则将匹配行及其前后n行一起打印出来 |
c | 如果匹配成功,则将匹配到的行数打印出来 |
E | 等于egrep,扩展 |
i | 忽略大小写 |
v | 取反,不匹配 |
w | 匹配单词 |
grep :把模式当做正则表达式
fgrep :把模式当做固定字符串
pgrep:通过匹配其程序名,找到匹配的进程
egrep:为 grep 的扩充版本, 改良了许多传统 grep 不能或不便的操作
正则字符介绍
参数 | 释义 |
---|---|
^ | 行首 |
$ | 行位 |
. | 除了换行符以外的任意单个字符 |
* | 前导字符的零个或多个 |
.* | 所有字符 |
[] | 字符组内的任一字符 |
[^] | 对字符组内的每个字符取反(不匹配字符组内的每个字符);^[^]字符组内的字符开头的行 |
[a-z] | 小写字母 |
[A-Z] | 大写字母 |
[a-Z] | 小写和大写字母 |
[0-9] | 数字 |
\< | 单词头(单词一般以空格或特殊字符做分隔,连续的字符串被当做单词) |
\> | 单词尾 |
扩展正则 sed 加 -r 参数 或转义
grep 加 -E 或 egrep 或转义
AWK 直接支持 但不包含{n,m}
可以使用–posix支持