10、正则表达式与扩展正则表达式详解

最新推荐文章于 2025-12-02 15:15:42 发布

echo99

最新推荐文章于 2025-12-02 15:15:42 发布

阅读量17

点赞数

CC 4.0 BY-SA版权

分类专栏：自动机理论与应用前沿文章标签：正则表达式扩展正则表达式反向引用

本文链接：https://blog.youkuaiyun.com/echo99/article/details/153607609

自动机理论与应用前沿专栏收录该内容

36 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

正则表达式与扩展正则表达式详解

1. 引言

在编程领域，我们常听到“正则表达式”这个术语。不过，实际使用的“正则表达式”和理论上的有所不同，实际应用中的“正则表达式”通常被称为正则表达式（regex）。正则表达式在众多环境中广泛应用，像 Perl、Python、Awk、egrep、lex、vi、emacs 等。它的发展受到理论正则表达式的影响，例如 Lex 中的正则表达式就和理论正则表达式相似，但在其他很多环境中，正则表达式差异较大。

如今许多正在使用的正则表达式能够表达比正则语言更大的语言族。比如，Perl 正则表达式可以表达 $L_1 = {a^nb a^n | n \geq 0}$ 和 $L_2 = {ww | w \in {a, b}^ }$，但无法表达语言 $L_3 = {a^n b^n | n \geq 0}$。证明一个语言能否用正则表达式表达，情况有所不同。证明一个语言可以用正则表达式表达相对容易，例如 $L_1$ 可以用 Perl 正则表达式 $(a^ )b\1$ 表达，$L_2$ 可以用 $((a|b)^*)\1$ 表达；但证明一个语言不能用某些工具表达通常比较困难，比如证明 $L_3$ 不能用 Perl 正则表达式表达。因此，对正则表达式进行形式化处理很有必要。