2016 ACM/ICPC Asia Regional Qingdao hdu5880 Family View

本文介绍了一种使用AC自动机进行文本中敏感词过滤的方法。通过建立AC自动机并遍历输入文本,可以高效地将文本中的敏感词替换为星号(*)。文中提供了完整的C++代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题意:敏感词屏蔽,给一堆敏感词,给一段文本,要求把文本中所有的敏感词用*代替。

题解:对敏感词建出AC自动机,在AC自动机上跑文本,就可以得到文本的每个前缀的最长匹配后缀,扫一遍即可得到结果。

#include <set>
#include <map>
#include <stack>
#include <queue>
#include <deque>
#include <cmath>
#include <vector>
#include <string>
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <iostream>
#include <algorithm>
using namespace std;
#define L(i) i<<1
#define R(i) i<<1|1
#define INF  0x3f3f3f3f
#define pi acos(-1.0)
#define eps 1e-9
#define maxn 1000100
#define MOD 1000000007

int n,m;
char s[maxn],ss[maxn];
int tmp[maxn];

struct Trie
{
    int next[maxn][30],fail[maxn],en[maxn],dep[maxn];
    int root,L;
    void init()
    {
        L = 0;
        root = newnode(-1);
    }
    int newnode(int depth)
    {
        for(int i = 0; i < 30; i++)
            next[L][i] = -1;
        dep[L] = depth + 1;
        en[L++] = 0;
        return L-1;
    }
    void Insert(char buf[])
    {
        int now = root;
        int len = strlen(buf);
        for(int i = 0; i < len; i++)
        {
            if(next[now][buf[i]-'a'] == -1)
                next[now][buf[i]-'a'] = newnode(dep[now]);
            now = next[now][buf[i]-'a'];
        }
        en[now] = 1;
    }
    void build()
    {
        queue<int> Q;
        fail[root] = root;
        for(int i = 0; i < 30; i++)
        {
            if(next[root][i] == -1)
                next[root][i] = root;
            else
            {
                fail[next[root][i]] = root;
                Q.push(next[root][i]);
            }
        }
        while(!Q.empty())
        {
            int now = Q.front();
            Q.pop();
            //en[now] += en[fail[now]];
            for(int i = 0; i < 30; i++)
            {
                if(next[now][i] == -1)
                    next[now][i] = next[fail[now]][i];
                else
                {
                    fail[next[now][i]] = next[fail[now]][i];
                    Q.push(next[now][i]);
                }
            }
        }
    }
    void solve()
    {
        memset(tmp,0,sizeof(tmp));
        getchar();
        gets(s);
        int len = strlen(s);
        int cur = root,pos;
        for(int i = 0; i < len; i++)
        {
            if(s[i] >= 'A' && s[i] <= 'Z')
                pos = s[i] - 'A';
            else if(s[i] >= 'a' && s[i] <= 'z')
                pos = s[i] - 'a';
            else
            {
                cur = root;                                 //关键
                continue;
            }
            cur = next[cur][pos];
            int temp = cur;
            while(temp != root)
            {
                if(en[temp])
                {
                    tmp[i+1]--;
                    tmp[i-dep[temp]+1]++;
                    break;
                }
                temp = fail[temp];
            }
        }
        long long val = 0;
        for(int i = 0; i < len; i++)
        {
            val += tmp[i];
            if(val > 0)
                printf("*");
            else
                printf("%c",s[i]);
        }
        printf("\n");
    }
} ac;
int main()
{
    int t,C = 1;
    scanf("%d",&t);
    while(t--)
    {
        scanf("%d",&n);
        ac.init();
        for(int i = 0; i < n; i++)
        {
            scanf("%s",s);
            ac.Insert(s);
        }
        ac.build();
        ac.solve();
    }
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值