(代码) 后缀数组+lcp的c++实现

本文介绍如何使用C++实现后缀数组(suffix array)和最长公共前缀(LCP)数组,主要参考GeeksforGeeks上的教程。通过封装SuffixArray类,包含了构造后缀数组和LCP的功能,适用于字符串匹配问题。代码已提供,方便日后直接使用。

suffix array后缀数组一般用于字符串匹配问题当中,一般来说可以用suffix tree解决的字符串匹配问题用suffix array都可以解决.

主要参考了geeksforgeeks上关于后缀数组和lcp(longest common prefix)的教程.

https://www.geeksforgeeks.org/suffix-array-set-2-a-nlognlogn-algorithm/

https://www.geeksforgeeks.org/%c2%ad%c2%adkasais-algorithm-for-construction-of-lcp-array-from-suffix-array/

自己封装了一个SuffixArray类,里面包含后缀数组和lcp.因为构造suffix array和lcp的代码量有些大,代码就贴在这里,以后万一需要用的时候可以直接拿来用...

struct Suffix{
    int _index;
    int _rank[2];
};

class SuffixArray{
public:
    vector<Suffix> getSuffixes(){return suffixes;}
    vector<int> getlcp(){return lcp;}

    //构建后缀数组
    void build(string& s);;
    static bool sortFunction(Suffix& a,Suf
### 计算LCP数组C++实现 计算最长公共前缀(LCP)数组通常是在构建后缀数组之后完成的任务。一种常见的方法是通过Kasai算法来高效地构造LCP数组[^1]。 以下是使用 Kasai 算法在 C++ 中计算 LCP 数组的一个例子: ```cpp #include <iostream> #include <vector> #include <string> using namespace std; // 函数用于交换两个整数的位置 void swap(int &a, int &b){ int temp = a; a = b; b = temp; } // 构建后缀数组 vector<int> build_suffix_array(const string& s) { int n = s.size(); vector<pair<char,int>> suffixes(n); for (int i=0; i<n; ++i) suffixes[i] = make_pair(s[i], i); sort(suffixes.begin(), suffixes.end()); vector<int> sa(n), rank(n); // 后缀数组和排名 for (int k=0; ;k++) { if ((1<<k)>=n) break; for (int i=0;i<n;++i) { pair<int,int> rnk={rank[suffixes[i].second], (suffixes[i].second+(1<<k)<n)?rank[(suffixes[i].second+(1<<k))]:-1}; suffixes[i]=make_pair(rnk,i); } sort(suffixes.begin(), suffixes.end()); for (int i=0;i<n;++i) sa[i]=(suffixes[i].second); for (int i=0;i<n;++i) rank[sa[i]]=(i==0 || suffixes[i].first!=suffixes[i-1].first)?i:rank[sa[i-1]]; } return sa; } // 使用 Kasai 算法构建 LCP 数组 vector<int> kasai_algorithm(const string& text, const vector<int>& suffixArray) { int n = text.length(); vector<int> lcp(n, 0); vector<int> invSuff(n, 0); for (int i = 0; i < n; ++i) invSuff[suffixArray[i]] = i; int k = 0; for (int i = 0; i < n; ++i) { if (invSuff[i] == n - 1) { k = 0; continue; } int j = suffixArray[invSuff[i] + 1]; while (i + k < n && j + k < n && text[i+k] == text[j+k]) ++k; lcp[invSuff[i]] = k; if (k != 0) --k; } return lcp; } ``` 上述代码实现了两部分功能:首先是`build_suffix_array()`函数用来创建给定字符串的后缀数组;其次是`kasai_algorithm()`函数利用已有的后缀数组来计算对应的LCP数组
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值