(二十) 正则表达式
正则表达式时你定义的模式模板,Linux工具可以用它来过滤文本。Linux工具如:sed编辑器能够在处理数据时使用正则表达式对数据进行模式匹配;
星号通配符(*):匹配任意个字符包括0个字符;
1.1 正则表达式类型
Linux中不同的应用程序可能会使用不同的正则表达式包括:编程语言(Java、Perl)、Linux使用工具(如:sed编辑)以及主流应用(MYSQL)
正则表达还是是通过正则表达式引擎(是一套底层软件)实现的:负责解释正则表达式模式并使用这些模式进行文本匹配;
在Linux中两种主流的正则表达式引擎:
- POSIX基础正则表达式(BRE)
- POSIX扩展正则表达式(ERE)
大部分Linux工具都至少符合BRE规范,能够识别该规范的定义的所有模式符号,但是SED编辑器值符合BRE引擎规范的子集;gawk编辑器用ERE引擎来处理它的正则表达式;
1.1.1 基础正则表达式
正则表达式区分大小写;
1、特殊字符
正则表达式在使用文本字符时,需要注意一些特殊字符,需要使用(\)进行转义;包括:.*1${}+?|();这些特殊字符在正则表达式中都有特殊