算法之字典树

字典树Trie)是一个比较简单的数据结构,也叫前缀树,用来存储和查询字符串。例如,waterwishwintietired这几个单词可以用以下方式存储:

其中每个字符占据一个节点,拥有相同前缀的字符串可以共用部分节点。起始点是特殊点(我们设为1号点),不存储字符。建树的代码如下:

const int MAXN = 500005;
int next[MAXN][26], cnt; // 用类似链式前向星的方式存图,next[i][c]表示i号点所连、存储字符为c+'a'的点的编号
void init() // 初始化
{
    memset(next, 0, sizeof(next)); // 全部重置为0,表示当前点没有存储字符
    cnt = 1;
}
void insert(const string &s) // 插入字符串
{
    int cur = 1;
    for (auto c : s)
    {
        // 尽可能重用之前的路径,如果做不到则新建节点
        if (!next[cur][c - 'a']) 
            next[cur][c - 'a'] = ++cnt; 
        cur = next[cur][c - 'a']; // 继续向下
    }
}

字典树可以方便地查询某个前缀是否存在:

bool find_prefix(const string &s) // 查找某个前缀是否出现过
{
    int cur = 1;
    for (auto c : s)
    {
        // 沿着前缀所决定的路径往下走,如果中途发现某个节点不存在,说明前缀不存在
        if (!next[cur][c - 'a'])
            return false;
        cur = next[cur][c - 'a'];
    }
    return true;
}

如果是查询某个字符串是否存在,可以另开一个exist数组,在插入完成时,把exist[叶子节点]设置为true,然后先按查询前缀的方法查询,在结尾处再判断一下exist的值。 这是一种常见的套路,即用叶子节点代表整个字符串,保存某些信息。

字典树是一种空间换时间的数据结构,我们牺牲了字符串个数×字符串平均字符数×字符集大小的空间,但可以用 O(n) 的时间查询,其中 n 为查询的前缀或字符串的长度。

来看一道例题:

洛谷P2580 于是他错误的点名开始了

题目背景
XS中学化学竞赛组教练是一个酷爱炉石的人。
他会一边搓 炉石一边点名以至于有一天他连续点到了某个同学两次,然后正好被路过的校长发现了然后就是一顿 欧拉欧拉欧拉(详情请见已结束比赛 CON900)。
题目描述
这之后校长任命你为特派探员,每天记录他的点名。校长会提供化学竞赛学生的人数和名单,而你需要告诉校长他有没有点错名。(为什么不直接不让他玩炉石。)
输入格式
第一行一个整数 n ,表示班上人数。
接下来 n 行,每行一个字符串表示其名字(互不相同,且只含小写字母,长度不超过 5050)。
第 n+2 行一个整数 m ,表示教练报的名字个数。
接下来 m 行,每行一个字符串表示教练报的名字(只含小写字母,且长度不超过 50 )。
输出格式
对于每个教练报的名字,输出一行。
如果该名字正确且是第一次出现,输出  OK,如果该名字错误,输出  WRONG,如果该名字正确但不是第一次出现,输出  REPEAT
说明/提示
对于 40% 的数据, n≤1000 , m≤2000 。
对于 70% 的数据, n≤104 , m≤2×104 。
对于 100% 的数据, n≤104 , m≤105 。

当然这个题其实用哈希表就可以轻松解决了,但也可以使用字典树。至于如何判断是否重复,只需要另开一个数组vis,每次查询后把叶子节点的vis设为true即可。代码如下:

#include <bits/stdc++.h>
using namespace std;
const int MAXN = 500005;
namespace trie
{
int next[MAXN][26], cnt;
bool vis[MAXN], exist[MAXN];
void init()
{
    memset(next, 0, sizeof(next));
    cnt = 1;
}
void insert(const string &s)
{
    int cur = 1;
    for (auto c : s)
    {
        if (!next[cur][c - 'a'])
            next[cur][c - 'a'] = ++cnt;
        cur = next[cur][c - 'a'];
    }
    exist[cur] = true;
}
int find(const string &s)
{
    int cur = 1, ans;
    for (auto c : s)
    {
        if (!next[cur][c - 'a'])
            return 0;
        cur = next[cur][c - 'a'];
    }
    if (!exist[cur])
        ans = 0;
    else if (!vis[cur])
        ans = 1;
    else
        ans = 2;
    vis[cur] = true;
    return ans;
}
} // namespace trie
int main()
{
    int n;
    cin >> n;
    trie::init();
    while (n--)
    {
        string s;
        cin >> s;
        trie::insert(s);
    }
    int q;
    cin >> q;
    while (q--)
    {
        string s;
        cin >> s;
        switch (trie::find(s))
        {
        case 0:
            cout << "WRONG" << endl;
            break;
        case 1:
            cout << "OK" << endl;
            break;
        case 2:
            cout << "REPEAT" << endl;
        }
    }
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值