- 对任何正则文法
G
,存在定义同一语言的正则表达式r
- 对任何正则表达式
r
,存在生成同一语言的正则文法G
正则文法到正则表达式的转换
- 将正则文法中的每个非终结符表示成关于它的一个正则表达式方程,获得一个联立方程组
- 依照求解规则:
- 若x=αx∣βx=\alpha x | \betax=αx∣β(若x=αx+βx=\alpha x + \betax=αx+β),则解为:x=α∗βx=\alpha^*\betax=α∗β
- 若x=xα∣βx=x\alpha | \betax=xα∣β(若x=xα+βx=x\alpha + \betax=xα+β),则解为x=βx∗x=\beta x^*x=βx∗
以及正则表达式的代数定理,求文法开始符号的正规式方程组的解。这个解释关于该文法开始符号S
的一个正规式。
例:
设有正则文法G:
Z→0A
Z \to 0A
Z→0A
A→0A∣0B A \to 0A | 0B A→0A∣0B
B→1A∣ϵ B\to 1A|\epsilon B→1A∣ϵ
试给出该文法生成语言的正则表达式
- 首先给出相应正则表达式方程组(即用
+
代替正则表达式|
)
Z→0A
Z \to 0A
Z→0A
2.
A→0A+0B
A \to 0A + 0B
A→0A+0B
3.
B→1A+ϵ
B\to 1A+\epsilon
B→1A+ϵ
将3式代入2式中得,
4.
A=0A+01A+0
A = 0A + 01A + 0
A=0A+01A+0
对4式利用分配率:
5.
A=(0+01)A+0
A = (0+01)A + 0
A=(0+01)A+0
对5式使用求解规则:
6.
A=(0+01)∗0
A=(0+01)^*0
A=(0+01)∗0
将式6代入式1中的A得:
Z=0(0+01)∗0
Z=0(0+01)^*0
Z=0(0+01)∗0
正则表达式到正则文法的转换
字母表∑\sum∑上的正则表达式到正则文法G=(VN,VT,P,S)G=(V_N, V_T,P,S)G=(VN,VT,P,S)的转换方法如下:
- 令VT=∑V_T=\sumVT=∑
- 对任意正则表达式
R
选择一个非终结符Z
生成规则Z→RZ \to RZ→R,并令S=ZS=ZS=Z - 若aaa和bbb都是正则表达式,对形如A→abA\to abA→ab的规则转换成A→aBA \to aBA→aB和B→bB\to bB→b两规则,其中
B
是新增的非终结符 - 在已转换的文法中,将形如A→a∗bA \to a^*bA→a∗b的规则进一步转换成A→aA∣bA \to aA | bA→aA∣b
- 不断利用第三和第四条规则进行变换,直到每条规则最多含有一个终结符。
例如:
将R=(a∣b)(aa)∗(a∣b)R=(a|b)(aa)^*(a|b)R=(a∣b)(aa)∗(a∣b)转换成相应的正则文法
令AAA是文法开始符号,根据第二条规则可变换为:
A→(a∣b)(aa)∗(a∣b)
A \to (a|b)(aa)^*(a|b)
A→(a∣b)(aa)∗(a∣b)
根据第三条规则变换为:
A→(a∣b)B A \to (a|b)B A→(a∣b)B
B→(aa)∗(a∣b) B \to (aa)^*(a|b) B→(aa)∗(a∣b)
根据第四条规则变换为:
A→aB∣bB
A \to aB|bB
A→aB∣bB
B→aaB∣a∣b B \to aaB|a|b B→aaB∣a∣b
根据第五条规则变换为:
A→aB∣bB
A \to aB|bB
A→aB∣bB
B→aC∣a∣b B \to aC|a|b B→aC∣a∣b
C→aB C\to aB C→aB