HDU 4749 KMP + BIT HASH

本文深入探讨了偏序匹配的概念及其与KMP算法的结合应用,通过实例展示了如何利用树状数组和预处理技巧实现高效的匹配判断。同时,文章详细介绍了算法的时间复杂度、空间复杂度及实现步骤,提供了实际代码片段作为参考。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

借鉴了别人的思路:http://edward-mj.com/archives/1632

求串A和串B偏序匹配的所有位置。偏序匹配就是保持大小关系的离散化后两个串一模一样。

1|A|,|B|10 5 ,1A i ,B i 25 

昨天网络赛的B题,我们当时随便弄了个 25(|A|+|B|)  的hash就过了,后来在Vani那听说有n lg k(k为字符集大小)的做法,想了一下总算明白了。记录一下。
其实满足以下两条性质的匹配关系都能KMP:

  1. 匹配的前缀性质。也就是说:若 A 1..n   B 1..n   匹配,那么对于任意 i=1..n  ,有 A 1..i   B 1..i   匹配。
  2. 偏序匹配符合传递性。假设用   表示两个串符合偏序匹配,那么 AB,BCAC 

既然能KMP了,关键就在于判断他们什么时候能往后面加一个字符。
考虑两个相同长度的串 A 1..n ,B 1..n   他们已经能够构成偏序匹配,那么假设现在新增了一个元素,构成了 A 1..n+1 ,B 1..n+1   ,那么他们同样能构成偏序匹配的充要条件是什么呢?
仔细想想不难YY到:
count(A i <A n+1 )=count(B i <B n+1 ),i=1..n 
count(A i =A n+1 )=count(B i =B n+1 ),i=1..n 
count(A i >A n+1 )=count(B i >B n+1 ),i=1..n 
因为n是固定的,所以只关注前两个条件即可。
然后这东西可以用树状数组维护。
KMP维护的实际是两个指针j和i,表示 A j..i     和  B 1..ij+1   匹配,本质上i和j都是递增的,所以i加的时候把a[i]放进BIT,j加的时候扔出树状数组即可。
而模式串因为只和前缀比较,所以可以预处理出low和eq数组

时间复杂度  O(nlog 2 k) 
空间复杂度  O(n) 

#include <set>
#include <map>
#include <cmath>
#include <queue>
#include <stack>
#include <string>
#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
using namespace std;

typedef  long long LL;
const double PI = acos(-1.0);

template <class T> inline  T MAX(T a, T b){if (a > b) return a;return b;}
template <class T> inline  T MIN(T a, T b){if (a < b) return a;return b;}

const int N = 111;
const int M = 11111;
const LL MOD = 1000000007LL;
const int dir[4][2] = {1, 0, -1, 0, 0, -1, 0, 1};
const int INF = 0x3f3f3f3f;

int last, n, m, k;
int f[33], a[111111], b[111111];
int next[111111], low[111111], eq[111111], mac[111111];

int get(int x)
{
    int res = 0;
    for (int i = x; i; i = i - (i & (-i)))
    {
        res = res + f[i];
    }
    return res;
}

void add(int x, int v)
{
    for (int i = x; i <= k; i = i + i & (-i))
    {
        f[i]+=v;
    }
}

void init()
{
    memset(f, 0, sizeof(f));
    low[0] = eq[0] = 0;
    for (int i = 1; i <= m; ++i)
    {
        low[i] = get(b[i] - 1);
        eq[i] = get(b[i]) - low[i];
        add(b[i], 1);
    }
}

bool check(int *a, int lim, int i, int j)
{
    while (last < lim) {add(a[last++], -1);}
    int l = get(a[i] - 1), e = get(a[i]) - l;
    return l == low[j] && e == eq[j];
}

void kmp()
{
    memset(f, 0, sizeof(f));
    next[1] = 0;
    add(b[1], 1);
    int ans = 0, j = 0;
    last = 1;
    for (int i = 2; i <= m; ++i)
    {
        while (j && !check(b, i - j, i, j + 1)) j = next[j];
        if (!j || check(b, i - j, i, j + 1)) j++;
        next[i] = j;
        add(b[i], 1);
    }
//    for (int i = 1; i <= m; ++i)
//        printf("%d ", next[i]);
//    printf("\n");
    memset(f, 0, sizeof(f));
    last = 1; j = 0;
    for (int i = 1; i <= n; ++i)
    {
        while (j && !check(a, i - j, i , j + 1)) j = next[j];
        if (!j || check(a, i - j, i, j + 1)) j++;
        if (j == m)
        {
            ans++;
            j = 0;
        }
        add(a[i], 1);
    }
    printf("%d\n", ans);
}


int main()
{
    while (scanf("%d%d%d", &n, &m, &k) != EOF)
    {
        for (int i = 1; i <= n; ++i)
            scanf("%d", &a[i]);
        for (int i = 1; i <= m; ++i)
            scanf("%d", &b[i]);
        init();
        kmp();
    }
    return 0;
}

HASH的做法

因为K比较小, 第K个数字算出的HASH值比较

O(NK) 

#include <set>
#include <map>
#include <cmath>
#include <queue>
#include <stack>
#include <string>
#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
using namespace std;

typedef  long long LL;
const double PI = acos(-1.0);

template <class T> inline  T MAX(T a, T b){if (a > b) return a;return b;}
template <class T> inline  T MIN(T a, T b){if (a < b) return a;return b;}

const int N = 111111;
const int M = 11111;
const LL MOD = 1000000007LL;
const int dir[4][2] = {1, 0, -1, 0, 0, -1, 0, 1};
const int INF = 0x3f3f3f3f;

int ah[33], bh[33];
int a[N], b[N];
int n, m, k;
int base = 29;
bool c[N];


int main()
{
    while (scanf("%d%d%d", &n, &m, &k) != EOF)
    {
        int i, j;
        int DEF = 1;
        for (i = 0; i < n; ++i)
            scanf("%d", &a[i]);
        for (i = 0; i < m; ++i)
            scanf("%d", &b[i]);
        for (i = 0; i < m - 1; ++i)
            DEF *= base;
        memset(ah, 0, sizeof(ah));
        memset(bh, 0, sizeof(bh));
        vector < int > ans;
        fill(c, c + n + 1, false);
        for (i = 0; i < m; ++i)
        {
            for (j = 0; j < k; ++j)
                bh[j] *= base;
            bh[b[i] - 1]++;
        }
        for (i = 0; i < n; ++i)
        {
            for (j = 0; j < k; ++j)
                ah[j] *= base;
            ah[a[i] - 1]++;
            if (i >= m - 1)
            {
                int t1 = k - 1, t2 = k - 1;
                bool sue = false;
                while (true)
                {
                    while (t1 >= 0 && ah[t1] == 0) t1--;
                    while (t2 >= 0 && bh[t2] == 0) t2--;
                    if (t1 == -1 && t2 == -1)
                    {
                        sue = true;
                        break;
                    }
                    if (t1 == -1 || t2 == -1) break;
                    if (ah[t1] != bh[t2]) break;
                    t1--; t2--;
                }
                if (sue) ans.push_back(i - m + 1);
                ah[a[i - m + 1] - 1] -= DEF;
            }
        }
        int last = -1, cnt = 0;
        for (i = 0; i < ans.size(); ++i)
        {
            if (ans[i] < last) continue;
            last = ans[i] + m;
            cnt++;
        }
        printf("%d\n", cnt);
    }
    return 0;
}


 

内容概要:《中文大模型基准测评2025年上半年报告》由SuperCLUE团队发布,详细评估了2025年上半年中文大模型的发展状况。报告涵盖了大模型的关键进展、国内外大模型全景图及差距、专项测评基准介绍等。通过SuperCLUE基准,对45个国内外代表性大模型进行了六大任务(数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、幻觉控制)的综合测评。结果显示,海外模型如o3、o4-mini(high)在推理任务上表现突出,而国内模型如Doubao-Seed-1.6-thinking-250715在智能体Agent和幻觉控制任务上表现出色。此外,报告还分析了模型性价比、效能区间分布,并对代表性模型如Doubao-Seed-1.6-thinking-250715、DeepSeek-R1-0528、GLM-4.5等进行了详细介绍。整体来看,国内大模型在特定任务上已接近国际顶尖水平,但在综合推理能力上仍有提升空间。 适用人群:对大模型技术感兴趣的科研人员、工程师、产品经理及投资者。 使用场景及目标:①了解2025年上半年中文大模型的发展现状与趋势;②评估国内外大模型在不同任务上的表现差异;③为技术选型和性能优化提供参考依据。 其他说明:报告提供了详细的测评方法、评分标准及结果分析,确保评估的科学性和公正性。此外,SuperCLUE团队还发布了多个专项测评基准,涵盖多模态、文本、推理等多个领域,为业界提供全面的测评服务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值