SPOJ 1811 LCS - Longest Common Substring(后缀自动机)

本文深入探讨了SAM(Suffix Array Machine)算法的应用,特别是在字符串匹配中的高效实现。通过实例讲解了如何利用SAM进行字符串匹配,包括节点跳转、失败指针调整等关键步骤,以及如何优化匹配过程以提高效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

传送门

题意:如题

这题其实就是SAM上跳fail的一个应用,我们一开始匹配的节点就在root,随着扔进去匹配不同的字符,我们不断的跳fail直到匹配到当前的字符,如果跳的图中pos变为-1了,即为跳回root之前的最初的未加入任何字符节点,这则表示失配,更新cnt就好了

如果找到一个pos不为-1的即匹配成功,那么我们更新cnt为len[pos]和cnt中较小的那个再加一即可(加一表示再加上当前这个字符,更新为较小的是因为肯定是小的一个匹配较长的一个,只能更新为较小的那一个)

 

#pragma GCC optimize(2)
#pragma GCC optimize(3)
#pragma GCC optimize(4)
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;

const int N = 3e5 + 10;
inline int read()
{
    char ch=getchar();
    int i=0,f=1;
    while(ch<'0'||ch>'9')
    {
        if(ch=='-')f=-1;
        ch=getchar();
    }
    while(ch>='0'&&ch<='9')
    {
        i=(i<<3)+(i<<1)+ch-'0';
        ch=getchar();
    }
    return i*f;
}
struct SAM
{
    static const int KN = N << 1;
    static const int KM = 27;
    int fail[KN], net[KN][KM], len[KN], cnt, root;
    int rig[KN],sum[KN];
    int newnode(int _len)
    {
        memset(net[cnt], -1, sizeof(net[cnt]));
//        fail[cnt] = -1;
        len[cnt] = _len;
        return cnt++;
    }
    void init()
    {
        cnt = 0;
        memset(fail,-1,sizeof(fail));
        root = newnode(0);
    }
    int add(int p, int x)//u--np,v---p
    {
        int np=newnode(len[p]+1);
        rig[np]=1;
        while(~p && net[p][x] == -1)    net[p][x] = np, p = fail[p];
        if(p == -1) fail[np] = root;
        else
        {
            int q = net[p][x];
            if(len[q] == len[p] + 1)    fail[np] = q;
            else
            {
                int nq = newnode(len[p] + 1);
                memcpy(net[nq], net[q], sizeof(net[q]));
                fail[nq] = fail[q];
                fail[q] = fail[np] = nq;
                while(~p && net[p][x] == q) net[p][x] = nq, p = fail[p];
            }
        }
        return np;
    }
    void build(char* s, char ch)
    {
        int now = root;
        for(int i = 0; s[i]; ++i)   now = add(now, s[i] - ch);
    }
    int ord[KN], pri[KN];
    void topo()
    {
        int maxVal=0;
        memset(pri, 0, sizeof(pri));
        for (int i = 0; i < cnt; ++i) maxVal = max(maxVal, len[i]), ++ pri[len[i]];
        for (int i = 1; i <= maxVal; ++i) pri[i] += pri[i - 1];
        for (int i = 0; i < cnt; ++i) ord[--pri[len[i]]] = i;
    }
    void gao(int k)
    {
        topo();
    }
} sam;
char s[N];
char ss[N];
int main()
{
    scanf("%s",s);
    scanf("%s",ss);
    sam.init();
    sam.build(s,'a');
    sam.topo();
    int cnt=0,pos=0,ans=0;
    for(int i=0; i<strlen(ss); i++)
    {
        while(~pos&&sam.net[pos][ss[i]-'a']==-1) pos=sam.fail[pos];
        if(pos==-1) pos=0,cnt=0;
        else cnt=min(sam.len[pos],cnt)+1,pos=sam.net[pos][ss[i]-'a'],ans=max(ans,cnt);
    }
    cout<<ans<<endl;
}

 

内容概要:本文探讨了在MATLAB/SimuLink环境中进行三相STATCOM(静态同步补偿器)无功补偿的技术方法及其仿真过程。首先介绍了STATCOM作为无功功率补偿装置的工作原理,即通过调节交流电压的幅值和相位来实现对无功功率的有效管理。接着详细描述了在MATLAB/SimuLink平台下构建三相STATCOM仿真模型的具体步骤,包括创建新模型、添加电源和负载、搭建主电路、加入控制模块以及完成整个电路的连接。然后阐述了如何通过对STATCOM输出电压和电流的精确调控达到无功补偿的目的,并展示了具体的仿真结果分析方法,如读取仿真数据、提取关键参数、绘制无功功率变化曲线等。最后指出,这种技术可以显著提升电力系统的稳定性与电能质量,展望了STATCOM在未来的发展潜力。 适合人群:电气工程专业学生、从事电力系统相关工作的技术人员、希望深入了解无功补偿技术的研究人员。 使用场景及目标:适用于要掌握MATLAB/SimuLink软件操作技能的人群,特别是那些专注于电力电子领域的从业者;旨在帮助他们学会建立复杂的电力系统仿真模型,以便更好地理解STATCOM的工作机制,进而优化实际项目中的无功补偿方案。 其他说明:文中提供的实例代码可以帮助读者直观地了解如何从零开始构建一个完整的三相STATCOM仿真环境,并通过图形化的方式展示无功补偿的效果,便于进一步的学习与研究。
### 关于EOJ DNA排序问题的解题思路 在处理EOJ中的DNA排序问题时,主要挑战在于如何高效地完成字符串数组的排序以及去重操作。由于题目涉及两个测试点可能因时间复杂度较高而超时,因此需要优化算法设计。 #### 数据结构的选择 为了降低时间复杂度并提高效率,可以引入`std::map`或者`unordered_map`来辅助实现去重功能[^1]。这些数据结构能够快速判断某项是否存在集合中,并支持高效的插入和查操作。具体来说: - 使用 `std::set` 可以自动去除重复元素并对结果进行升序排列; - 如果还需要自定义比较逻辑,则可以选择基于哈希表的数据结构如 `unordered_set` 配合手动排序。 #### 排序策略 对于给定的一组DNA序列(通常表示为长度固定的字符串),按照字典顺序对其进行排序是一个常见需求。C++标准库提供了非常方便的方法来进行此类任务——即利用 `sort()` 函数配合合适的比较器函数对象或 lambda 表达式来指定所需的排序规则。 下面展示了一个简单的例子用于说明如何读取输入、执行必要的预处理步骤(包括但不限于删除冗余条目),最后输出经过整理的结果列表: ```cpp #include <bits/stdc++.h> using namespace std; int main(){ set<string> uniqueDNAs; string line, dna; while(getline(cin,line)){ stringstream ss(line); while(ss>>dna){ uniqueDNAs.insert(dna); // 自动过滤掉重复项 } } vector<string> sortedUnique(uniqueDNAs.begin(),uniqueDNAs.end()); sort(sortedUnique.begin(),sortedUnique.end()); for(auto it=sortedUnique.cbegin();it!=sortedUnique.cend();++it){ cout<<*it; if(next(it)!=sortedUnique.cend())cout<<" "; } } ``` 上述程序片段实现了基本的功能模块:从标准输入流逐行解析得到各个独立的DNA片段;借助 STL 容器特性轻松达成无重复记录维护目的;最终依据字母大小关系重新安排各成员位置后再统一打印出来[^3]。 #### 学习延伸至自然语言处理领域 值得注意的是,在计算机科学特别是机器学习方向上,“上下文”概念同样重要。例如 Word2Vec 这样的技术就是通过考察周围词语环境来捕捉特定词汇的意义特征[^2]。尽管两者应用场景差异显著,但从原理层面看均体现了对局部模式挖掘的关注。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值