编译原理中的正规表达式转NFA

编译原理实习任务要求将正规表达式转化为NFA。通过使用四个栈来处理状态,包括一个状态栈和两个用于处理' '| '情况的状态栈。在实现过程中,最后半天找到了有效的算法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

编译原理老师布置了一次实习:给定一个正规表达式转化成NFA。虽然花了2、3天,但真正想出可行的算法时,也就是最后半天。。。


主要应用到了四个栈,一个保存所有状态,另外两个用来存储当有“|”时,首尾两个状态,还有一个用来弹出新的状态。部分代码:

//解析函数
int solve(int t,char *a)  //t为初态
{
	int x,y,sign=0,consist=0;
	stack<char> s;
	stack<int> start;
	stack<int> end;
	s.push(t);
	start.push(t);
	int l=strlen(a);
	for(int i=0;i<l;i++){
		//////////////第一类情况
		if(a[i]=='('){
			consist=consist+1;
			char b[100];
			int k=0;
			for(int j=i+1;j<l;j++){
				b[k++]=a[j];
				if(a[j+1]==')'){b[k]='\0';break;}
			}
			if(consist==1&&!start.empty()){
				y=solve(start.top(),b);s.push(y);
				if(sign>0&&(j+2==l||a[j+2]=='|')){
					m[num].x=s.top();
					m[num].y='$';
					m[num++].z=end.top();
				}
				
			}
			else {
				y=so
### 编译原理中的正规表达式换为NFA编译原理中,将正规表达式(Regular Expression, RE)换成非确定有限自动机(Non-deterministic Finite Automaton, NFA)是一个重要的过程。此过程中采用的方法之一是通过算符优先算法来构建NFA[^1]。 #### 构建NFA的基本原则 对于给定的正规表达式,可以按照特定的原则将其逐步分解并映射到相应的子NFA上: - **字符匹配**:如果正规表达式仅由单个字符`a`组成,则创建一个简单的两状态机器,其中有一个从初始状态指向接受状态的标记为`a`的边。 - **连接操作**:当遇到两个连续的符号或更复杂的结构时,如`ab`,那么前一部分对应的NFA的结束节点会变成下一部分起始节点的一部分;即第一个模串对应NFA的终止状态变为第二个模串所代表NFA的起点[^3]。 - **选择分支**:面对竖线分隔的选择项,比如`a|b`,需要引入一个新的开始点和终点,并分别向这两个选项各自的NFA提供ε-moves作为过渡路径。 - **闭包处理**:星号(`*`)表示零次或多次数重复前面的内容。为此,在相应位置设置循环回路即可满足需求——让当前部分既能继续前进也能返回重新尝试该片段。 为了实现上述逻辑,通常还需要先将输入字符串解析为逆波兰表示形(Reverse Polish Notation),这有助于简化后续计算流程[^4]。 ```python from collections import deque class State: def __init__(self, is_accepting=False): self.transitions = {} self.is_accepting = is_accepting def re_to_nfa(postfix_expr): stack = [] for char in postfix_expr: if char.isalnum(): # 字母数字直接生成简单NFA start_state = State() end_state = State(is_accepting=True) start_state.transitions[char] = {end_state} nfa_pair = (start_state, end_state) elif char == '|': # 或者关系 right_end, right_start = stack.pop() left_end, left_start = stack.pop() new_start = State() new_end = State(is_accepting=True) new_start.transitions[''] = {left_start, right_start} # ε-move for state in [left_end, right_end]: state.transitions[''].add(new_end) nfa_pair = (new_start, new_end) elif char == '.': # 连接操作 right_end, right_start = stack.pop() left_end, left_start = stack.pop() left_end.transitions[''].add(right_start) # 将左边结尾连至右边开头 nfa_pair = (left_start, right_end) elif char == '*': # 星号闭包 single_end, single_start = stack.pop() new_start = State() new_end = State(is_accepting=True) new_start.transitions[''] = {single_start, new_end} # 可选跳过整个序列 single_end.transitions[''].add(single_start) # 循环回到自身头部 single_end.transitions[''].add(new_end) # 结束后可到达最终态 nfa_pair = (new_start, new_end) else: raise ValueError(f"未知的操作符 '{char}'") stack.append(nfa_pair) return stack[-1][0], set([stack[-1][-1]]) ``` 这段Python代码展示了如何根据不同的运算符建立不同类型的NFA组件,并利用栈数据结构管理这些中间结果直到完成整个RE到NFA化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值