基于DFA的单词识别

该博客探讨了一种使用确定有限自动机(DFA)进行单词识别的方法,通过简化DFA状态转移实现内存优化。文章介绍了基本要求,包括设置初始和终态,并给出了输入输出形式的示例。在解决内存过大的问题上,提出了使用数组替代数据结构的策略,但代码仍有待完善。此外,还提供了部分测试用例及其输出结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基于DFA的单词识别问题的一种描述是:编写一个程序,输入一个确定的有穷自动机(DFA),使用该DFA识别单词。
【基本要求】设置DFA初始状态X,终态Y,过程态用数字表示:0 1 2 3………
【输入形式】标准输入
【输出形式】标准输出
【样例输入】
a b#
X Y 0 2#
X X-a->0 X-b->X

Y Y-a->0 Y-b->X

0 0-a->0 0-b->2

2 2-a->0 2-b->Y

abb#
ba#
aca#
【样例输出】
a
b
b
pass
b
a
error
a
error

可以借鉴思路,代码在测试平台会显示运行内存过大,可以运用数组来改变内存使用。具体请自己改,本人做的不够完整,望理解。

#include <iostream>
#include <string>
#include <vector>
#include <map>
using namespace std;


void SimplifyDFA(vector<string>& trans_v, vector<string>& symbol_v)
{
	map<char, map<char, char>> m;
	for (vector<string>::iterator it = trans_v.begin(); it != trans_v.end(); it++)
	{
		map<char, char> M;
		int x = 1;
		try
		{
			while (x < (int)(*it).length())
			{
				M.insert(pair<char, char>((*it)[x + 3], (*it)[x + 6]));//a:0\b:X
				x = x + 7;
			}
			m.insert(pair<char, map<char, char>>((*it)[0], M));//{X:{a:0\b:X}}
		}
		catch (exception e)
		{

		}
		M.clear();
	}

	for (vector<string>::iterator str_it = symbol_v.begin(); str_it != symbol_v.end(); str_it++)
	{
		char begin = 'X';
		for (string::iterator char_it = (*str_it).begin(); char_it != (*str_it).end(); char_it++)
		{
			if ((*char_it) != '#')
			{
				map<char, char>::iterator iter = m[begin].find((*char_it));
				if (iter != m[begin].end())
				{
					cout << (*char_it) << endl;
					begin = iter->second;
				}
				else
				{
					cout << "error" << endl;
					break;
				}
			}
			else
			{
				if (begin == 'Y')
				{
					cout << "pass" << endl;
				}
				else
				{
					cout << "error" << endl;
				}
			}
		}
	}
}


int main()
{
	string char_str;
	getline(cin, char_str);
	string char_state;
	getline(cin, char_state);
	string trans_express;
	getline(cin, trans_express, '\n');
	vector<string> trans_express_v;
	trans_express_v.push_back(trans_express);
	while (trans_express.length() > 0)
	{
		getline(cin, trans_express, '\n');
		trans_express_v.push_back(trans_express);
	}
	//SimplifyDFA(trans_express_v,m);
	vector<string> symbol_string_v;
	string symbol_string;
	getline(cin, symbol_string, '\n');
	symbol_string_v.push_back(symbol_string);
	while (symbol_string.length()>0)
	{
		getline(cin, symbol_string, '\n');
		symbol_string_v.push_back(symbol_string);
	}
	//IdentifyWord(symbol_string_v,m);
	SimplifyDFA(trans_express_v, symbol_string_v);
	return 0;
}



1. 实验内容 1、定义一个右线性正规文法,示例如(仅供参考) G[S]:S→aU|bV| U→bV|aQ V→aU|bQ Q→aQ|bQ|e 实验前要考虑清楚用哪种数据结构存储上述文法。 2、构造其有穷确定自动机,如 3、利用有穷确定自动机M=(K,Σ,f, S,Z)行为模拟程序算法,来对于任意给定的串,若属于该语言时,该过程经有限次计算后就会停止并回答“是”,若不属于,要么能停止并回答“不是”。 K:=S; c:=getchar; while ceof do {K:=f(K,c); c:=getchar; }; if K is in Z then return (‘yes’) else return (‘no’) 2. 实验设计分析 2.1 实验设计思路 根据实验指导书和书本上的相关知识,实现算法。 2.2 实验算法 (1)输入正规文法。RG到FA (2)将NFA化为DFA (3)输入一个字符串判断是否符合文法。 ①最开始记A为开始状态a为第一个字符。 ②然后A经过字符a到达下一个状态记为B,A状态指向B状态,a指向字符串的下一个字符。 ③循环②步直到B状态为终态时停止则该字符串符合该文法或a指向最后一个字符时都没到终态停止则该字符窜不符合该文法。 2.3 实验流程 ①预习实验,实验前阅读实验指导书和阅读书本。 ②通过书本了解判断文法的原理。首先在纸上模拟文法的判断过程。 ③上机实现模拟过程。 ④调试程序,知道能得到预期的结果。 2.4 实验的基本技术设计方案 (用到哪些技术,包括编译原理中,程序设计中,离散数学中等的哪些技术) ①java的基础语法。 ②数据结构里的结构体及简单算法。 ③编译原理的理论知识。 ④运用了java里的一些集合类。 2.5 数据结构 class edge { char PriorityState; char ch; char NextState; edge(char p,char c, char n){ PriorityState = p; ch = c; NextState = n; } @Override public String toString() { return "edge [PriorityState=" + PriorityState + ", ch=" + ch + ", NextState=" + NextState + "]"; } } 2.6 实验输入输出 2.7 实验设计语言 Java语言。 3. 实验主要源代码及分析说明
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值