0. 前言
正则表达式是一种用于描述字符串模式的语言;许多搜索和雕刻文本的工具都依赖于一种称为正则表达式的模式语言。
在代码中,正则表达式描述文本上的匹配模式。它们通常用于描述文本中的位置(例如,匹配此模式的所有行)和转换文本(例如,将匹配模式的文本转换为不同的文本)。
代码中的正则表达式没有标准,但大多数语言都使用来自共同祖先的方言。每个程序员都应该知道的三种主要方言是:
- 基本正则表达式(BRE);
- 扩展正则表达式(ERE);
- perl兼容正则表达式(PCRE)。
更多关于此部分理论知识的介绍,可拓展阅读 Sculpting text with regex, grep, sed, awk, emacs and vim。
表达式的两个基本元素:
- 以一个字面值或变量表示的值
- 一个操作符
正则表达式是由这些相同的元素组成的。任意字符(除开下面“1章节”中讲解的元字符除外)都被解释为只匹配它本身的字面值。
编写正则表达式的三个步骤:
(1&#