linux正则表达式

DaxiaLeeSuper

已于 2023-04-04 17:53:09 修改

阅读量273

点赞数

分类专栏： Linux 文章标签：正则表达式 linux

于 2022-08-21 22:21:44 首次发布

本文链接：https://blog.youkuaiyun.com/DaxiaLeeSuper/article/details/126455891

版权

Linux 专栏收录该内容

20 篇文章

订阅专栏

1. 基础正则表达式

RE字符	意义与范例
^word	意义：待查找的字符串（word）在行首 ————————————————— 范例：查找行首为#的哪一行，并列出行号 grep '^#' my_re.txt
word$	意义：待查找的字符串（word）在行尾 ————————————————— 范例：查找行首为!的哪一行，并列出行号 grep '!$' my_re.txt
^$	意义：空白行
.	意义：代表一定有一个任意字符的字符 ————————————————— 范例：查找的字符串可以是（bvb)(bab)(bbb)(bb)，但不能仅有(bb)，即b与b之间一定仅有一个字符，而空格符也是字符 grep 'b.b' my_re.txt
\s	意义：匹配空格
\	意义：转义字符，将特殊符号的特殊意义去除 ———————————————————— 范例：查找含有单引号'的那一行 grep '\'' my_re.txt
*	意义：重复0个到无穷多个前一个字符 ————————————————— 范例：找出含有(bs)(bss)(bsss)等的字符串，注意，因为可以是0个，所以bs也是符合带查找的字符串。另外，因为为重复"前一个RE字符串"的符号，因此，在之前必须要紧接着一个RE字符，例如任意字符为"." grep 'bss*' my_re.txt
[list]	意义：从字符集合的RE字符里面找出想要选取的字符 ——————————————————————— 范例：查找含有(gl)或(gd)的那一行，需要特别留意的是，在[]当中代表一个带查找的字符，例如"a[afl]y"代表查找的字符串可以是aay，afy，aly，即[afl]代表a或f或l的意思 grep 'g[ld]' my_re.txt
[n1-n2]	意义：从字符集合的RE字符里面找出想要选取的字符范围 ————————————————————————— 范例：查找含有任意数字的那一行。需要特别注意，在字符集合[]中减号-是有特殊意义的，它代表两个字符之间的所有连续字符。但这个连续与否与ASII编码有关，因此，你的编码需要设置证券（在bash中，需要确定LANG与LANGUAGE的变量是否正确）例如所有大写字符为[A-Z] grep '[0-9]' my_re.txt
[^list]	意义：从字符集合的RE字符里面找出不要的字符串或范围 ————————————————————————— 范例：查找的字符串可以是(oog)(ood)但不能是(oot)，那个^在[]内时代表的意义是“反向选择”的意思。例如，我不要大写字符，则为[^A-Z]。但是，需要特别注意的是，如果以grep -n '[^A-Z]' my_re.txt来查找，却发现该文件内所有行都被列出，为什么？因为这个[^A-Z]是“非大写字符”的意思，因为每一行均有非大写字符。 grep 'oo[^t]' my_re.txt
\{n,m\}	意义：连续n到m个的前一个RE字符，若为\{n\}则是连续n个前一个RE字符，若为\{n,\}则是连续n个以上的前一个RE字符 ————————————————————————————————————————— 范例：在g与g之间有2到3个o存在的字符，即(goog)(gooog) grep 'go\{2,3\}g' my_re.txt

2. 扩展正则表达式

grep默认只支持基础正则表达式，下面扩展正则表达式需要使用grep -E或者egrep，建议使用egrep，直接区分命令比较好记忆，egrep和grep -E是类似命令和别名的关系。

RE字符	意义与范例
+	意义：重复一个或一个以上前一个RE字符 ————————————————— 范例：查找(god)(good)(goood)等的字符串，o+代表一个以上的o egrep -n 'go+d' my_re.txt
?	意义：重复0个或一个前一个RE字符 ————————————————— 范例：查找(gd)(god)这两个字符串，o?代表0个o或者1个o egrep -n 'go?d' my_re.txt
\|	意义：用或(or)的方式找出数个字符串 ————————————————— 范例：查找(gd)(good)这两个字符串，如果还想找出dog字符串 egrep -n 'gd\|good' my_re.txt egrep -n 'gd\|good\|dog' my_re.txt
( )	意义：找出“组”字符串 —————————— 范例：查找(glad)或(good)这两个字符串，因为g与d是重复的，所以可以将la和oo列与()中，并以\|来分隔就好了 egrep -n 'g(la\|oo)d' my_re.txt
( )+	意义：多个重复组判别 —————————— 范例：查找"AxyzxyzxyzxyzC"的字符串，意思是需要查找以A开头以C结尾，中间有一个以上xyz字符串 egrep -n 'A(xyz)+C' my_re.txt