正则表达式与正则前缀码的性质及分解
正则表达式相关性质
扩展正则表达式语言的非封闭性
可以证明语言 ${a^nb^nc^n | n \geq1}$ 不是扩展正则表达式语言。同时,扩展正则表达式语言族在补运算下不封闭。例如,语言 $L_1 = {a^m | m > 1 且 m 不是素数 }$ 可以用扩展正则表达式 $(aaa^ )\1(\1)^ $ 表示。假设 $L_1$ 的补集 $L_1^c$ 是扩展正则表达式语言,应用引理可知,存在 $n_1 \geq0$,$n_2 \geq1$,使得对于所有 $j > 0$,$a^{n_1 + j \cdot n_2} \in L_1^c$。但这是矛盾的,因为不可能对于所有 $j > 0$,$n_1 + j \cdot n_2$ 都是素数。而且,$L_1$ 是单字母表上的扩展正则表达式语言,但不是上下文无关语言,这意味着存在不属于上下文无关语言布尔闭包的扩展正则表达式语言。
扩展正则表达式语言与上下文相关语言的关系
扩展正则表达式语言是上下文相关语言
为了证明这一点,只需说明每个扩展正则表达式语言都能被线性有界自动机(LBA)接受,即一种线性空间的非确定性图灵机。对于给定的扩展正则表达式,如果没有反向引用,可以直接构造一个有限自动机来接受所有匹配该正则表达式的单词。
处理反向引用时,需要存储每个匹配由一对括号包围的子表达式的字符串以供后续使用。如果扩展正则表达式中有 $m$ 对括号,则需要 $m$ 个缓冲区。将输入字符串中匹配第 $i$ 对括号内容的部分存储在第 $i$ 个缓冲区中。
具体步骤如下:
1. 给扩展正则表达式
超级会员免费看
订阅专栏 解锁全文
31万+

被折叠的 条评论
为什么被折叠?



