trie树

本文介绍了Trie树(字典树)的基本概念、核心思想及其实现方式,详细讲解了Trie树的插入、查找等操作,并通过实例展示了如何用C++实现Trie树。此外,还对比了Trie树与Hash表在不同场景下的应用效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

根据网易题库,对trie树的理解如下:trie树又称为字典查找树,主要用于统计和查询,可以统计单词前缀的个数。其解决问题的思路主要来源于:

http://blog.youkuaiyun.com/hackbuteer1/article/details/7964147

十分感谢,并对之进行稍微的修改。使之以C++的方式进行实现。
Trie 的强大之处就在于它的时间复杂度。它的插入和查询时间复杂度都为 O(k) ,其中 k 为 key 的长度,与 Trie 中保存了多少个元素无关。Hash 表号称是 O(1) 的,但在计算 hash 的时候就肯定会是 O(k) ,而且还有碰撞之类的问题;Trie 的缺点是空间消耗很高。
  至于Trie树的实现,可以用数组,也可以用指针动态分配,我做题时为了方便就用了数组,静态分配空间。
Trie树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。
Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。
Trie树的基本性质可以归纳为:
(1)根节点不包含字符,除根节点意外每个节点只包含一个字符。
(2)从根节点到某一个节点,路径上经过的字符连接起来,为该节点对应的字符串。
(3)每个节点的所有子节点包含的字符串不相同。
Trie树有一些特性:
1)根节点不包含字符,除根节点外每一个节点都只包含一个字符。
2)从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。
3)每个节点的所有子节点包含的字符都不相同。
4)如果字符的种数为n,则每个结点的出度为n,这也是空间换时间的体现,浪费了很多的空间。
5)插入查找的复杂度为O(n),n为字符串长度。
基本思想(以字母树为例):
1、插入过程
对于一个单词,从根开始,沿着单词的各个字母所对应的树中的节点分支向下走,直到单词遍历完,将最后的节点标记为红色,表示该单词已插入Trie树。
2、查询过程
同样的,从根开始按照单词的字母顺序向下遍历trie树,一旦发现某个节点标记不存在或者单词遍历完成而最后的节点未标记为红色,则表示该单词不存在,若最后的节点标记为红色,表示该单词存在。

二、字典树的数据结构:
利用串构建一个字典树,这个字典树保存了串的公共前缀信息,因此可以降低查询操作的复杂度。
下面以英文单词构建的字典树为例,这棵Trie树中每个结点包括26个孩子结点,因为总共有26个英文字母(假设单词都是小写字母组成)。
Trie树的根结点不包含任何信息,第一个字符串为”abc”,第一个字母为’a’,因此根结点中数组next下标为’a’-97的值不为NULL,在实际的问题中可以将标记颜色的标志位改为数量count等其他符合题目要求的变量。
已知n个由小写字母构成的平均长度为10的单词,判断其中是否存在某个串为另一个串的前缀子串。下面对比3种方法:

1、 最容易想到的:即从字符串集中从头往后搜,看每个字符串是否为字符串集中某个字符串的前缀,复杂度为O(n^2)。

2、 使用hash:我们用hash存下所有字符串的所有的前缀子串。建立存有子串hash的复杂度为O(n*len)。查询的复杂度为O(n)* O(1)= O(n)。

3、 使用Trie:因为当查询如字符串abc是否为某个字符串的前缀时,显然以b、c、d….等不是以a开头的字符串就不用查找了,这样迅速缩小查找的范围和提高查找的针对性。所以建立Trie的复杂度为O(n*len),而建立+查询在trie中是可以同时执行的,建立的过程也就可以成为查询的过程,hash就不能实现这个功能。所以总的复杂度为O(n*len),实际查询的复杂度只是O(len)。
三、Trie树的操作
在Trie树中主要有3个操作,插入、查找和删除。一般情况下Trie树中很少存在删除单独某个结点的情况,因此只考虑删除整棵树。
1、插入
假设存在字符串str,Trie树的根结点为root。i=0,p=root。
1)取str[i],判断p->next[str[i]-97]是否为空,若为空,则建立结点temp,并将p->next[str[i]-97]指向temp,然后p指向temp;
若不为空,则p=p->next[str[i]-97];
2)i++,继续取str[i],循环1)中的操作,直到遇到结束符’\0’,此时将当前结点p中的 exist置为true。
2、查找
假设要查找的字符串为str,Trie树的根结点为root,i=0,p=root
1)取str[i],判断判断p->next[str[i]-97]是否为空,若为空,则返回false;若不为空,则p=p->next[str[i]-97],继续取字符。
2)重复1)中的操作直到遇到结束符’\0’,若当前结点p不为空并且 exist 为true,则返回true,否则返回false。

#include<iostream>
#include<string>
#include<vector>
using namespace std;
typedef struct trie_node
{
    int count;//统计单词前缀出现的次数
    struct trie_node *next[26];//指向各个子树的指针,因为每个字符下面都有26个字母
    bool exist;//标记该节点是否构成单词
}trie_node,*trie;
trie_node* CreateTrieNode()
{
    trie_node* node=(trie_node*)malloc(sizeof(trie_node));
    node->count=0;
    node->exist=false;
    memset(node->next,0,sizeof(node->next));//初始化为空指针
    return node;
}
void TrieInsert(trie root,const char *word)//单词插入
{
    trie node = root;
    const char *p = word;
    int id;
    while(*p)
    {
        id = *p - 'a';
        if(node->next[id] == NULL)
        {
            node->next[id]=CreateTrieNode();
        }
        node = node->next[id];//每插入一步,相当于有一个新串经过,指针向下移动 
        ++p;
        node->count += 1;// 这行代码用于统计每个单词前缀出现的次数
    }
    node->exist=true;
}
int TrieSearch(trie root,const char *word)
{
    trie node = root;
    const char *p = word;
    int id;
    while(*p)
    {
        id = *p - 'a';
        node = node->next[id];
        ++p;
        if(node == NULL)
        {
            return 0;
        }
    }
    return node->count;
}

int main()
{
    trie root = CreateTrieNode();
    int number = 0;
    cin>>number;
    const char *temp;
    string s;
    while(number--)
    {
        cin>>s;
        temp=s.c_str();
        if(strlen(temp)!=0)
        {
            TrieInsert(root,temp);
        }

    }
    int search_num=0;
    cin>>search_num;
    vector<int> coll;
    int word_num=0;
    while(search_num--)
    {
        cin>>s;
        word_num = TrieSearch(root,s.c_str());
        coll.push_back(word_num);
    }
    vector<int>::iterator iter;
    for(iter=coll.begin();iter!=coll.end();++iter)
    {
        cout<<*iter<<endl;
    }
    system("pause");
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值