最大重复出现子串

本文介绍了一种利用后缀数组寻找字符串中最长重复子串的方法。通过生成后缀数组并排序,检测相邻字符串的公共部分,实现高效查找。提供了一个示例程序,演示了如何找出给定字符串中的最长重复子串。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

输入一个字符串,如何求最大重复出现的字符串呢?比如输入ttabcftrgabcd,输出结果为abc, canffcancd,输出结果为can。

给定一个字符串,求出其最长的重复子串。

分析:使用后缀数组,对一个字符串生成相应的后缀数组后,然后再排序,排完序依次检测相邻的两个字符串的开头公共部分。
这样的时间复杂度为:

  • 生成后缀数组 O(N)
  • 排序 O(NlogN*N) 最后面的 N 是因为字符串比较也是 O(N)
  • 依次检测相邻的两个字符串 O(N * N)

故最终总的时间复杂度是 O(N^2*logN)

#include <stdio.h>
#include <stdlib.h>

#define SIZE 10000
char str[SIZE], *pstr[SIZE];

int pstrcmp(char* p, char* q) {
	return strcmp(*(char* const *) p, *(char* const *) q);
}

int getCommonLen(char* p, char* q) {
	int len = 0;
	while (*p && *(p++) == *(q++)) {
		len++;
	}
	return len;
}

void initRearArr(char* src) {
	int len = strlen(src);
	int i = 0;
	for (i = 0; i < len; ++i) {
		pstr[i] = &str[i];
		str[i] = src[i];
	}
	str[i] = '\0';
}

char* getMaxRepeatSubStr() {
	int i = 0;
	int len = strlen(str);
	int maxLen = 0, maxId = 0;
	int temp = 0;
	for (i = 0; i < len - 1; i++) {
		if ((temp = getCommonLen(pstr[i], pstr[i + 1])) > maxLen) {
			maxLen = temp;
			maxId = i;
		}
	}

	char* p = pstr[maxId];
	char* result = calloc(sizeof(char), maxLen + 1);
	for (i = 0; i < maxLen; i++) {
		result[i] = *(p + i);
	}
	result[i] = '\0';
	return result;
}

int main(void) {
	char* src = "canffcancd";
	initRearArr(src);

	qsort(pstr, strlen(src), sizeof(char*), pstrcmp);

	puts("最大重复子串:");
	puts(getMaxRepeatSubStr());
	return EXIT_SUCCESS;
}


### C++ 实现最长无重复字符子串算法 为了找到给定字符串中最长不含重复字符的子串长度,可以采用滑动窗口的方法。这种方法通过维护两个指针来表示当前考察的子串范围,并利用哈希表记录字符最近一次出现的位置。 下面是一个完整的 C++ 函数实现: ```cpp #include <unordered_map> #include <string> using namespace std; int lengthOfLongestSubstring(const string& s) { unordered_map<char, int> charIndexMap; // 记录字符及其最新位置 int maxLength = 0; int start = 0; for (int end = 0; end < s.length(); ++end) { if (charIndexMap.find(s[end]) != charIndexMap.end() && charIndexMap[s[end]] >= start) { start = charIndexMap[s[end]] + 1; } charIndexMap[s[end]] = end; maxLength = max(maxLength, end - start + 1); } return maxLength; } ``` 此函数接收一个 `const string&` 类型参数并返回整数类型的最长不重复子串长度[^4]。该方法的时间复杂度为 O(n),其中 n 是输入字符串的长度;空间复杂度取决于不同字符的数量,在最坏情况下可能达到 O(min(m,n)),m 表示 ASCII 字符集大小而 n 则是字符串最大长度。 对于不同的测试案例,上述代码能够正确处理各种情况下的输入数据,例如当所有字符都相同时(如 `"bbbbbb"`),或者存在多个相同字符的情况(如 `"pwwkew"`)。此外,如果整个字符串本身即为非重复,则会得到等于原字符串长度的结果(如 `"abcdef"`)[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值