poj1035

本文介绍了一种基于链表数组的拼写纠错算法,通过将字典中的单词按长度分类并链接起来,实现对输入单词的快速匹配和纠错。文章详细阐述了数据结构设计和搜索策略,并提供了一个C++实现案例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一次AC呀,本来想用vector<string>来保存字典,然后暴搜,后来在breeze害羞的提示下想到了用链表数组dict,把字典中的单词按照长度分一下类,然后把长度相同的链在一起,头结点保存在dict[i]中,其中i是单词的长度。虽然最终用了1563MS,但感觉写得还算漂亮,调理比较清晰。

定义了两个结构:

链表:

typedef struct Node
{
string word;
unsigned pos;//记录输入的字典单词在字典中的位置,主要是因为在输出的时候如果有多个候选的单词则要按照候选单词在字典中出现的顺序输出,所以需要保存这个位置
struct Node *next;
}Node;

需要注意的是,结构成员中含有类(string),所以在分配新结点的时候要用new,不能用malloc


用于保存候选单词,及其出现的位置:
typedef struct Result
{
string word;//用于存储可能的单词
unsigned pos;//用于存储这些可能的单词在字典中的位置
}Result;


步骤:

1. 在长度相同的单词链中查找,如果找到完全相同的,则输出,否则如果找到只有一个字母不同的则压入result中;

2. 在长度小1的单词链中查找,找到一个不相等的字符,则比较这个字符之后的串是否相等;

3. 在长度大1的单词链中查找,找到一个不相等的字符,则比较这个字符之后的串是否相等。


输出:

呵呵,没有用排序。。而是先找到result中最小和最大的pos

for(i=min; i<=max; ++i)
{
for(j=0; j<result.size(); ++j)
{
if(result[j].pos == i)
{
cout<<" "<<result[j].word;
break;
}
}
}

貌似效率有点低了,但毕竟result一般不会太大。。。


//Problem: 1035
//Memory: 840K  Time: 1563MS 
//Language: C++  Result: Accepted 

#include<iostream>
#include<vector>
#include<string>
#include<algorithm>

using namespace std;

#define MAX_WORD_LEN 17
#define MAX_DICT 10000

typedef struct Node
{
	string word;
	unsigned pos;//记录输入的字典单词在字典中的位置
	struct Node *next;
}Node;
typedef struct Result
{
	string word;//用于存储可能的单词
	unsigned pos;//用于存储这些可能的单词在字典中的位置
}Result;

int main()
{
	unsigned i,j,same;
	Node *dict[MAX_WORD_LEN];//用一个链表数组来存储词典,把长度相同的单词存在一个链表中
	vector<Result> result;//用于存储可能的单词
	Result r;

	for(i=0; i<MAX_WORD_LEN; ++i)//初始化
	{
		dict[i] = new Node;//注意struct中有类,分配新节点时要用new
		if(dict[i] == NULL)
			return -1;
		else
		{
			dict[i]->word = "";
			dict[i]->pos = 0;
			dict[i]->next = NULL;
		}
		
	}
	string s;
	unsigned pos=0;
	Node *node;
	Node *p;
	cin>>s;
	while(s.compare("#"))
	{
		++pos;
		node = new Node;
		node->word = s;
		node->pos = pos;
		node->next = NULL;
		p = dict[s.size()];
		while(p->next)
		{
			p = p->next;
		}
		p->next = node;

		cin>>s;
	}
	cin>>s;
	while(s.compare("#"))
	{
		p = dict[s.size()];
		while(p->next)
		{
			p = p->next;
			same = 0;
			for(i=0; i<s.size(); ++i)
			{
				if(s[i]!=(p->word)[i])
				{
					if(s.compare(i+1,s.size()-(i+1),p->word,i+1,(p->word).size()-(i+1))==0)//找到可以通过替换一个字母得到s的单词
					{
						r.word = p->word;
						r.pos = p->pos;
						result.push_back(r);
					}
					break;
				}
				else
					++same;
			}
			if(same==s.size())//找到完全相同的单词
			{
				cout<<s<<" is correct"<<endl;
				break;
			}
		}
		if(same!=s.size())//在长度相同的链表中没有找到完全相同的单词,接下来在长度小1和大1的链里面找
		{
			p = dict[s.size()-1];//在长度小1的链里面找
			while(p->next)
			{
				p = p->next;
				//找到第一个不相同的字母的位置,比较s中该位置之后的子串和p->word中该位置开始的子串
				//如果这两个子串相同则可以通过删除s中该位置上的字母来得到dict中的单词
				for(i=0; i<(p->word).size();++i)
				{
					if(s[i]!=(p->word)[i])
					{
						if(s.compare(i+1,s.size()-(i+1),p->word,i,(p->word).size()-i)==0)
						{
							r.word = p->word;
							r.pos = p->pos;
							result.push_back(r);
						}
						break;
					}
				}
				if(i==(p->word).size())//s的前面的s.size()-1个字母都与字典相同,只是多了最后一个字母,可以通过删除该字母达到与字典相同
				{
					r.word = p->word;
					r.pos = p->pos;
					result.push_back(r);
				}
			}

			p = dict[s.size()+1];//在长度大1的链里面找
			while(p->next)
			{
				p = p->next;
				//找到第一个不相同的字母的位置,比较s中该位置之后的子串和p->word中该位置开始的子串
				//如果这两个子串相同则可以通过在s中该位置上添加该字母来得到dict中的单词
				for(i=0; i<s.size();++i)
				{
					if(s[i]!=(p->word)[i])
					{
						if(s.compare(i,s.size()-i,p->word,i+1,(p->word).size()-(i+1))==0)
						{
							r.word = p->word;
							r.pos = p->pos;
							result.push_back(r);
						}
						break;
					}
				}
				if(i==s.size())//s的前面的s.size()个字母都与字典相同,只是少了最后一个字母,可以通过添加该字母达到与字典相同
				{
					r.word = p->word;
					r.pos = p->pos;
					result.push_back(r);
				}
			}
			if(result.size())
			{
				cout<<s<<":";
				unsigned min = MAX_DICT;
				unsigned max = 0;
				for(i=0; i<result.size(); ++i)
				{
					if(result[i].pos < min)
						min = result[i].pos;
					if(result[i].pos > max)
						max = result[i].pos;
				}
				for(i=min; i<=max; ++i)
				{
					for(j=0; j<result.size(); ++j)
					{
						if(result[j].pos == i)
						{
							cout<<" "<<result[j].word;
							break;
						}
					}
				}
			}
			else
				cout<<s<<":";
			cout<<endl;
		}
		result.clear();
		cin>>s;
	}
	return 0;
}



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值