正则表达式

最新推荐文章于 2024-05-20 10:35:51 发布

原创最新推荐文章于 2024-05-20 10:35:51 发布 · 283 阅读

CC 4.0 BY-SA版权

正则表达式，又称规则表达式。（英语：Regular Expression，在代码中常简写regex、regexp或RE），计算机科学的一个概念。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。

正则就是用一些具有特殊含义的符号组合到一起（称为正则表达式）来描述字符或者字符串的方法。或者说：正则就是用来描述一类事物的规则。。

给定一个正则表达式和另一个字符串，我们可以达到如下的目的：
1. 给定的字符串是否符合正则表达式的过滤逻辑（称作“匹配”）；
2. 可以通过正则表达式，从字符串中获取我们想要的特定部分。
正则表达式的特点是：
1. 灵活性、逻辑性和功能性非常的强；
2. 可以迅速地用极简单的方式达到字符串的复杂控制。
3. 对于刚接触的人来说，比较晦涩难懂。
由于正则表达式主要应用对象是文本，因此它在各种文本编辑器场合都有应用，小到著名编辑器EditPlus，大到Microsoft Word、Visual Studio等大型编辑器，都可以使用正则表达式来处理文本内容。

grep

参数	释义
n	显示行号
o	只显示匹配内容
q	静默模式，无任何输出
$?	配合上面‘q’来判断执行成功没有，即有没有过滤到想要的内容
l	如果匹配成功，只打印文件名，失败则不打印
r	‘r’通常rl一起用
A	如果匹配成功，则将匹配行及其后n行一起打印出来
B	如果匹配成功，则将匹配行及其前n行一起打印出来
C	如果匹配成功，则将匹配行及其前后n行一起打印出来
c	如果匹配成功，则将匹配到的行数打印出来
E	等于egrep，扩展
i	忽略大小写
v	取反，不匹配
w	匹配单词

grep ：把模式当做正则表达式
fgrep ：把模式当做固定字符串
pgrep：通过匹配其程序名，找到匹配的进程
egrep：为 grep 的扩充版本, 改良了许多传统 grep 不能或不便的操作

正则字符介绍

参数	释义
^	行首
$	行位
.	除了换行符以外的任意单个字符
*	前导字符的零个或多个
.*	所有字符
[]	字符组内的任一字符
[^]	对字符组内的每个字符取反（不匹配字符组内的每个字符）；^[^]字符组内的字符开头的行
[a-z]	小写字母
[A-Z]	大写字母
[a-Z]	小写和大写字母
[0-9]	数字
\<	单词头（单词一般以空格或特殊字符做分隔,连续的字符串被当做单词）
\>	单词尾