本文假定读者已有一定的正则表达式基础。正则表达式推荐入门读物《正则表达式必知必会》(百度可以找到电子版,很薄的一本书,讲的通俗易懂,很快就可以学完)
一.Why
为什么要在使用Linux的时候使用正则表达式,因为Linux中经常有检索目录或者检索文件内容的操作,而正则表达式在字符串匹配和替换方面有着强大的功能,能够提高我们的工作效率。举两个简单的例子。
(1)特定文件的检索
笔者今天刚好想要看看在cuda的lib目录下有没有libcudnn文件,但是该目录下的文件很多,直接看很难看出来,所以我们可以利用正则表达式来进行匹配,找出符合条件的文件。命令如下:
ls | grep 'cudnn'
(2)文本内容的检索
笔者想要查看caffe的Makefile.config文件中和CUDA有关的配置,同时那些已经被注释掉的行不希望被打印出来。命令如下:
cat Makefile.config | grep 'CUDA' | grep -v '^#'
这样注释的内容中即使有CUDA也不会打印出来。
而除了用在命令中,正则表达式在shell脚本中也发挥着重要的作用
二.What
Linux的正则表达是怎么样的?
其实大部分的语法和《必知必会》讲的差不多,在这里以表格的形式整理出来,方便查看。
参考鸟哥的书,这里分为基础正则表达式和扩展正则表达式
2.1基础正则表达式:
(1)基础正则表达式字符
(2)特殊符号
2.2扩展正则表达式
扩展的正则表达式能够实现更多的组合功能,从而减少检索的次数
(1)扩展正则表达式字符
三 、How
复习了正则表达式的之后,我们需要知道该如何在Linux中使用正则表达式。下面同样是分为基础和扩展两个部分来讲
3.1 基础正则表达式在Linux中的使用
可以使用正则表达式的常见命令有grep和 sed。grep和sed的区别在于,grep是以行为单位,进行字符串的对比,sed则可以进行删除、替换等更多的功能。
(1)grep
grep使用正则表达式的格式非常简单
格式:
grep [-n] [-A] [-B] [--color==auto] '搜索的字符串' filename
-n 表示 显示打印出来的数据的行号
-A 后加数字,是after的意思,打印该行和后面的N行
-B 后加数字,是befer的意思,打印该行和前面的N行
‘搜索字符串’即是正则表达式。
此外,grep 加上-v可以用于取反,即打印出不符合检索条件的行的数据。
(2)sed [-nefri] [动作]
n :使用安静(silent)模式。在一般 sed 癿用法中,所有来自 STDIN 的数据一般都会被列出到屏幕上。但如果加上 -n 参数后,则只有经过 sed 特殊处理癿那一行(或者动作)才会被列出来。
-e :直接在指令列模式上迚行 sed 动作编辑;
-f :直接将 sed 的动作写在一个档案内,
-f filename 则可以执行 filename 内的sed 动作;
-r :sed 的动作支持的是延伸行正规表示法的语法。(预设是基础型正规表达法)
-i :直接修改读的档案内容,而不是由屏幕输出。
动作说明: [n1[,n2]]function
n1, n2 不见得会存在,一般代表选择进行动作癿行数,举例来说,如果我的动作是需要在 10 到 20 行之间进行的,则 10,20[动作行为] function下有以下的参数可以选择
a :新增, a 的后面可以接字符串,而这些字符串会在新的一行出现(目前的下一行)
c:取代, c 的后面可以接字符串,这些字符串可以取代 n1,n2 之间的行
d :删除,因为是删除,所以 d 后面通常不接任何东西;
i :插入, i的后面可以接字符串,而这些字符串会在新的一行出现(目前的上一行);
p :打印,亦即将某个选择的数据印出。通常 p 会不参数 sed -n 一起运作
s :替代,可以直接运行替代的工作!通常这个 s的动作作可以搭配正则表示法!例如 1,20s/old/new/g 就是啦!
sed的写法看起来复杂一点,需要结合一些实例去理解和使用。
3.2扩展正则表示式
需要实用egrep命令才能使用扩展的正则表达式,命令和用法和grep类似。
参考文献
《鸟哥的Linux私饭菜》
《正则表达式必知必会》