正则表达式

正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写regex、regexp或RE),计算机科学的一个概念。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。

正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。。

给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);
2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。
正则表达式的特点是:
1. 灵活性、逻辑性和功能性非常的强;
2. 可以迅速地用极简单的方式达到字符串的复杂控制。
3. 对于刚接触的人来说,比较晦涩难懂。
由于正则表达式主要应用对象是文本,因此它在各种文本编辑器场合都有应用,小到著名编辑器EditPlus,大到Microsoft Word、Visual Studio等大型编辑器,都可以使用正则表达式来处理文本内容。

grep

参数释义
n显示行号
o只显示匹配内容
q静默模式,无任何输出
$?配合上面‘q’来判断执行成功没有,即有没有过滤到想要的内容
l如果匹配成功,只打印文件名,失败则不打印
r‘r’通常rl一起用
A如果匹配成功,则将匹配行及其后n行一起打印出来
B如果匹配成功,则将匹配行及其前n行一起打印出来
C如果匹配成功,则将匹配行及其前后n行一起打印出来
c如果匹配成功,则将匹配到的行数打印出来
E等于egrep,扩展
i忽略大小写
v取反,不匹配
w匹配单词

grep :把模式当做正则表达式
fgrep :把模式当做固定字符串
pgrep:通过匹配其程序名,找到匹配的进程
egrep:为 grep 的扩充版本, 改良了许多传统 grep 不能或不便的操作

正则字符介绍

参数释义
^行首
$行位
.除了换行符以外的任意单个字符
*前导字符的零个或多个
.*所有字符
[]字符组内的任一字符
[^]对字符组内的每个字符取反(不匹配字符组内的每个字符);^[^]字符组内的字符开头的行
[a-z]小写字母
[A-Z]大写字母
[a-Z]小写和大写字母
[0-9]数字
\<单词头(单词一般以空格或特殊字符做分隔,连续的字符串被当做单词)
\>单词尾

扩展正则 sed 加 -r 参数 或转义
grep 加 -E 或 egrep 或转义
AWK 直接支持 但不包含{n,m}
可以使用–posix支持

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值