[kuangbin带你飞]专题17:D - Detect the Virus(ZOJ3430)

本文介绍了一个结合AC自动机与Base64解码的算法实现,用于识别和统计病毒签名在文本中的出现次数。通过将Base64解码后的ASCII码转化为整数数组,再利用AC自动机进行模式匹配,有效解决了重复记录问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原题

AC自动机模版 + base64的解码

wa1 : 同个匹配串内多次出现的病毒只记录一次。
wa2 : 范围为256的部分特殊字符char的强制类型转换有问题(不确定)
解决:得到ascll码的int数组, 把int型数组作为匹配串直接去匹配

#include<iostream>
#include<stack>
#include<queue>
#include<string>
#include<cstring>
#include<cstdio>
#include<vector>
using namespace std;

const int MAXN = 50010;

int map(char c) {
    if(c >= 'A' && c <= 'Z') return c - 'A';
    else if(c >= 'a' && c <= 'z') return  c - 'a' + 26;
    else if(c >= '0' && c <= '9') return c - '0' + 52;
    else if(c == '+') return 62;
    else return 63;
}

int ascll[MAXN];

int change(string s) {
    //init
    queue<int> q;   
    memset(ascll, 0, sizeof(ascll));

    int l = (int)s.length();
    for(int i = 0; i < l && s[i] != '='; i++) {
        int temp = map(s[i]);
        for(int i = 5; i >= 0; i--) q.push(temp>>i & 1);
    }
    int k = 0;
    while(q.size() >= 8) {//8个一取,小于8时即代表剩下的都是添加的0
        for(int i = 7; i >= 0; i--) {
            if(q.front()) ascll[k] += 1<<i;
            q.pop();
        }
        k++;
    }
    ascll[k] = -1;
    return k;
}


int node[MAXN][256], fail[MAXN], End[MAXN];
int root, L;
bool vis[MAXN];
int newnode() {
    for(int i = 0; i < 256; i++) node[L][i] = -1;
    fail[L] = -1;
    End[L] = 0;
    L++;
    return L-1;
}

void init() {
    L = 0;
    root = newnode();
}

void insert(int l) {
    int now = root;
    for(int i = 0; i < l; i++) {
        int id = ascll[i];
        if(node[now][id] == -1) node[now][id] = newnode();
        now = node[now][id];
    }
    End[now]++;
}

void setfail() {
    queue<int> q;
    q.push(root);
    while(!q.empty()) {
        int now = q.front(); q.pop();
        for(int i = 0 ; i < 256; i++) if(node[now][i] != -1) {
            int pre = fail[now];
            while(pre != -1 && node[pre][i] == -1) pre = fail[pre];
            fail[node[now][i]] = pre  == -1 ? root : node[pre][i];
            q.push(node[now][i]);
        }
    }

}
int query(int l) {
    int now = root;
    int cnt = 0;
    for(int i = 0; i < l; i++) {
        int id = ascll[i];
        while(now != -1 && node[now][id] == -1) now = fail[now];
        now = now == -1 ? root : node[now][id];
        for(int p = now; p != -1; p = fail[p]) if(End[p] && !vis[p]) {
            cnt += End[p];
            vis[p] = true;
        }
    }
    return cnt;
}

int main() {
    freopen("a.in", "r", stdin);
    ios::sync_with_stdio(false);
    int n;
    string s;
    while(cin >> n) {
        init();
        for(int i = 1; i <= n; i++) {
            cin >> s; insert(change(s));
        }
        setfail();
        cin >> n;
        while(n--) {
            memset(vis, false, sizeof(vis));
            cin >> s; cout << query(change(s)) << endl;
        }
        cout << endl;
    }
    return 0;
}
### 关于 kuangbin ACM 算法竞赛培训计划 #### 数论基础专题介绍 “kuangbin专题十四涵盖了数论基础知识的学习,旨在帮助参赛者掌握算法竞赛中常用的数论概念和技术。该系列不仅提供了丰富的理论讲解,还推荐了一本详细的书籍《算法竞赛中的初等数论》,这本书包含了ACM、OI以及MO所需的基础到高级的数论知识点[^1]。 #### 并查集应用实例 在另一个具体的例子中,“kuangbin”的第五个专题聚焦于并查集的应用。通过解决实际问题如病毒感染案例分析来加深理解。在这个场景下,给定一组学生及其所属的不同社团关系图,目标是从这些信息出发找出所有可能被传染的学生数目。此过程涉及到了如何高效管理和查询集合成员之间的连通性问题[^2]。 #### 搜索技巧提升指南 对于简单的搜索题目而言,在为期约两周的时间里完成了这一部分内容的学习;尽管看似容易,但对于更复杂的状况比如状态压缩或是路径重建等问题,则建议进一步加强训练以提高解题能力[^3]。 ```python def find_parent(parent, i): if parent[i] == i: return i return find_parent(parent, parent[i]) def union(parent, rank, x, y): rootX = find_parent(parent, x) rootY = find_parent(parent, y) if rootX != rootY: if rank[rootX] < rank[rootY]: parent[rootX] = rootY elif rank[rootX] > rank[rootY]: parent[rootY] = rootX else : parent[rootY] = rootX rank[rootX] += 1 # Example usage of Union-Find algorithm to solve the virus spread problem. ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值