字典树简介
特点
2)从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。
3)每个节点的所有子节点包含的字符都不相同。
原理
利用串构建一个字典树,这个字典树保存了串的公共前缀信息,因此可以降低查询操作的复杂度。
#define MAX 26
typedef struct TrieNode //Trie结点声明
{
bool isStr; //标记该结点处是否构成单词
struct TrieNode *next[MAX]; //儿子分支
}Trie;
其中next是一个指针数组,存放着指向各个孩子结点的指针。
Trie树的操作
1.插入
假设存在字符串str,Trie树的根结点为root。i=0,p=root。
1)取str[i],判断p->next[str[i]-97]是否为空,若为空,则建立结点temp,并将p->next[str[i]-97]指向temp,然后p指向temp;
若不为空,则p=p->next[str[i]-97];
2)i++,继续取str[i],循环1)中的操作,直到遇到结束符'\0',此时将当前结点p中的isStr置为true。
2.查找
假设要查找的字符串为str,Trie树的根结点为root,i=0,p=root
1)取str[i],判断判断p->next[str[i]-97]是否为空,若为空,则返回false;若不为空,则p=p->next[str[i]-97],继续取字符。
2)重复1)中的操作直到遇到结束符'\0',若当前结点p不为空并且isStr为true,则返回true,否则返回false。
3.删除
删除可以以递归的形式进行删除。
Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.
注意:本题只有一组测试数据,处理到文件结束.
Output
对于每个提问,给出以该字符串为前缀的单词的数量.
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#define M 26
typedef struct Node
{
int sub_str_count;//用来记录字串的个数,当初没有想到加入这样一个变量来记录子串个数
struct Node *next[M];
}T_Node;
struct Q_queue
{
T_Node *a[100000];
int head;
int rear;
};
void Init_Struct(T_Node *one)
{
int i=0;
one->sub_str_count=1;
for(i=0;i<M;i++)
{
one->next[i]=NULL;
}
}
int find_2(T_Node *root,char *str)
/*这种办法是先看看单词是不是在字典树里面,如果是,然后再访问最后一个节点,
作为开始,看看节点的个数*/
{
struct Q_queue Q;
T_Node *p,*q=root;
int i=0,count=0,sum=0;
int j;
Q.head=0;
Q.rear=0;
for(j=0;str[j]!='\0';j++)
{
if(q->next[str[j]-'a']==NULL)
{
return -1;
}
else
{
q=q->next[str[j]-'a'];
}
}
Q.a[Q.rear++]=q;
while(Q.head<Q.rear)
{
p=Q.a[Q.head++];
count=0;
for(i=0;i<M;i++)
{
if(p->next[i]==NULL)
{
count++;
}
else
{
Q.a[Q.rear++]=p->next[i];
}
}
if(count==M)
{
sum++;
}
}
return sum;
}
void insert(char *str,T_Node *root)
{
int i=0;
T_Node *p=root;
T_Node *t;
for(i=0;str[i]!='\0';i++)
{
if(p->next[str[i]-'a']==NULL)//说明移动到最后了,就是这个字母在没有在这个位置出现过
{
t=(T_Node*)malloc(sizeof(T_Node));
Init_Struct(t);
p->next[str[i]-'a']=t;
p=p->next[str[i]-'a'];
}
else
{
p=p->next[str[i]-'a'];//沿着路线向后移动
p->sub_str_count++;
}
}
}
int visit(T_Node *root,char *str)
{
T_Node *p=root;
int i=0;
for(i=0;str[i]!='\0';i++)
{
if(p->next[str[i]-'a']==NULL)
{
return -1;
}
p=p->next[str[i]-'a'];
}
return p->sub_str_count;
}
int main()
{
T_Node root;
int i;
int n=6;
int m=6;
int count=0;
char str[80];
Init_Struct(&root);//初始化root的next数组为NULL
freopen("input.txt","r",stdin);
while(n--)
{
gets(str);
insert(str,&root);
}
while(m--)
{
gets(str);
printf("%d\n",find_2(&root,str));
}
return 0;
}