正则表达式到最小化DFA(python实现)
实现目标
- 分析用户输入的正则表达式(包含基本 运算),对操作进行理解
- 转换至NFA
- 转换至DFA
- 最小化DFA
- 利用最小DFA分析输入字符串是否匹配
- 交互操作和可视化
实现效果见最后。
构建正则表达式过程
- 构建字母表
与输入自适应
- 添加与操作符号
# 添加与运算符
def inputR():
var.set(ei.get())
s = list(var.get().replace(' ', ''))
i = 0
while i < len(s) - 1:
if s[i] not in ['|', '·', '*', '(', ')'] and s[i + 1] not in ['|', '·', '*', ')']:
s.insert(i + 1, '·')
i = 0
elif s[i] in ['*', ')'] and s[i + 1] not in ['|', '·', '*', ')']:
s.insert(i + 1, '·')
i = 0
i += 1
var.set(''.join(s))
- 构建逆波兰表达式(后缀表达式)
调度场(Shunting yard)算法:
-
建立运算符栈用于运算符的存储,此运算符遵循越往栈顶优先 级越高的原则
-
顺序扫描表达式,如果当前字符是字母(优先级为0的符号) ,则直接输出;如果当前字符为运算符或者括号(优先级不为 0的符号),则判断:
- 若当前运算符为’(’ ,直接入栈;
- 若为’)’ ,出栈并顺序输出运算符直到遇到第一个’(’ ,遇到的第一个 '('出栈但不输出;
- 若为其它,比较运算符栈栈顶元素与当前元素的优先级:
a. 如果栈顶元素是’(',当前元素直接入栈;
b. 如果栈顶元素优先级>=当前元素优先级,出栈并顺序输出运算符直到 栈顶元素优先级<当前元素优先级,然后当前元素入栈;
c. 如果栈顶元素优先级<当前元素优先级,当前元素直接入栈。
-
重复上述操作直至表达式扫描完毕
-
顺序出栈并输出运算符直到栈元素为空
# 从中缀表达式到逆波兰表达式
def infixToSuffix(infix): # infix是中缀形式
pr = {
'|': 1, '·': 2, '*': 3, '(': 0, ')': 4} # 设置优先级表
sp = [] # 存放符号的堆栈
result = '' # 存放结果
# 调度场算法
for i in infix:
if i not in ['|', '·', '*', '(', ')']: # 非操作符输出
result += i
elif i == '(': # '('入栈
sp.append(i)
elif i == ')': # ')'出栈并输出,直到栈顶为'(','('出栈但不输出
p = ''
while p != '(':
result += p
p = sp.pop()
elif len(sp) == 0 or pr[sp[-1]] < pr[i]: # 如果当前op优先级大于栈顶优先级或栈为空,入栈
sp.append(i)
else:
while len(sp) != 0 and pr[sp[-1]] >= pr[i]: # 出栈至当前op优先级小于栈顶优先级或栈为空
result += sp.pop()
sp.append(i)
while len(sp) != 0: # 将剩余的栈内元素依次输出
result += sp.pop()
逆波兰表达式至NFA
NFA的表示
State(ID、start、accepted)
Transition(source state、target state 、char/ε)
逆波兰表达式至NFA
自下而上
- NFA的栈运算 n 遇到字母,构建基本NFA入栈
- 遇到运算符,出栈相应数量的NFA,
- 构建新的NFA并入栈
def suffixToNfa