poj 3261 Milk Patterns (后缀数组)

这篇博客介绍了一个利用后缀数组和最长公共前后缀(LCP)解决POJ 3261 Milk Patterns问题的方法。通过二分查找答案长度并使用LCP进行判断,找出给定字符串中至少出现k次的最长重复子串。代码中详细展示了如何构建后缀数组和LCP数组,并实现了判断功能。
poj 3261 Milk Patterns

题意:
给定一个字符串S,求至少出现k次的最长重复子串,这k个子串可以重叠。

限制:
1 <= |S| <= 20000

思路:
二分答案长度用lcp判断

/*poj 3261 Milk Patterns
  题意:
  给定一个字符串S,求至少出现k次的最长重复子串,这k个子串可以重叠。
  限制:
  1 <= |S| <= 20000
  思路:
  二分答案长度用lcp判断
 */
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int N = 20005;
const int INF = 20001;
int n; //构造后缀数组的字符串的长度
int times; //倍数
int sa[N]; //"排在第几的是谁"
int rank[N], tmp_rank[N]; //"你排第几"
bool cmp_sa(int i, int j) {
	if (rank[i] != rank[j])
		return rank[i] < rank[j];
	else {
		int ri = i + times <= n ? rank[i + times] : -1;
		int rj = j + times <= n ? rank[j + times] : -1;
		return ri < rj;
	}
}
void build_sa(int *S, int *sa) {
	for (int i = 0; i <= n; ++i) {
		sa[i] = i;
		rank[i] = S[i];
	}
	for (times = 1; times <= n; times <<= 1) {
		sort(sa, sa + n + 1, cmp_sa);
		tmp_rank[sa[0]] = 0;
		for (int i = 1; i <= n; ++i) {
			tmp_rank[sa[i]] = tmp_rank[sa[i - 1]] + cmp_sa(sa[i - 1], sa[i]);
		}
		for (int i = 0; i <= n; ++i) {
			rank[i] = tmp_rank[i];
		}
	}
}

int lcp[N];
void build_lcp(int *S, int *sa, int *lcp) {
	int h = 0;
	for(int i = 0; i < n; ++i) {
		int j = sa[rank[i] - 1];
		if(h > 0) --h;
		for(; j + h < n && i + h < n; ++h) {
			if(S[j + h] != S[i + h]) break;
		}
		lcp[rank[i] - 1] = h;
	}
}

bool used[N];

bool ok(int len, int k){
	bool ret = false;
	int cnt = 0;
	for(int i = 0; i < n; ++i){
		if(lcp[i] >= len){
			if(used[sa[i]] == 0){
				used[sa[i]] = 1;
				++cnt;
			}
			if(used[sa[i+1]] == 0){
				used[sa[i+1]] = 1;
				++cnt;
			}
		}
		else cnt = 0;
		if(cnt >= k) ret = true;
	}
	for(int i = 0; i < n; ++i)
		used[sa[i]] = used[sa[i+1]] = 0;
	return ret;
}

void gao(int *a, int k, int n){
	a[n] = -1;
	build_sa(a, sa);
	build_lcp(a, sa, lcp);
	//for(int i = 0; i <= n; ++i){
	//	cout<<lcp[i]<<' ';
	//}
	//cout<<endl;
	int L = 0, R = INF;
	while(L + 1 < R){
		int mid = (L + R) >> 1;
		if(ok(mid, k)) L = mid;
		else R = mid;
	}
	printf("%d\n", L);
}

int a[N];
int main(){
	int k;
	scanf("%d%d", &n, &k);
	for(int i = 0; i < n; ++i)
		scanf("%d", &a[i]);
	gao(a, k, n);
	return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值