题目描述
题目来源于POJ 2752,要求我们对于给定的若干字符串(这些字符串总长不超过4×10^5),在每个字符串中找出所有既是前缀又是后缀的子串长度。例如,在字符串 "ababcababababcabab" 中,既是前缀又是后缀的子串包括 "ab"、"abab"、"ababcabab" 和 "ababcababababcabab"。
输入格式
输入包含若干行,每行一个字符串。
输出格式
对于每个字符串,输出一行,包含若干个递增的整数,表示所有既是前缀又是后缀的子串长度。
输入样例
ababcababababcabab
aaaaa
输出样例
2 4 9 18
1 2 3 4 5
解题思路
为了找到字符串中既是前缀又是后缀的所有子串长度,我们可以使用哈希技术来快速比较前缀和后缀是否相同。具体步骤如下:
- 读取字符串:逐行读取输入的字符串。
- 计算哈希值:对字符串的每个前缀进行哈希处理,并存储这些哈希值。
- 检查前缀和后缀匹配:通过比较前缀和相应长度的后缀的哈希值,判断它们是否相等。如果相等,则该长度的子串即是前缀也是后缀。
- 输出结果:输出所有满足条件的子串长度。
代码实现
#include<bits/stdc++.h>
using namespace std;
typedef unsigned long long ukr;
char s1[400002];
ukr jinzhi = 27; // 基数设置为27
ukr h1[400002]; // 存储前缀哈希值
ukr power[400002]; // 存储基数的幂次
// 检查函数,验证当前长度i的前缀是否也是后缀
void check(int len) {
for (int i = 1; i <= len; i++) {
if (h1[i] == h1[len] - h1[len - i] * power[i]) {
printf("%d ", i);
}
}
printf("\n");
}
int main() {
while (scanf("%s", s1 + 1) != EOF) { // 逐行读取输入字符串
h1[0] = 0; // 初始化哈希数组
int len = strlen(s1 + 1); // 获取字符串长度
for (int i = 1; i <= len; i++) {
// 计算前缀哈希值
h1[i] = jinzhi * h1[i - 1] + s1[i] - 'a' + 1;
}
power[0] = 1; // 初始化幂次数组
for (int i = 1; i <= len; i++) {
// 计算基数的幂次
power[i] = jinzhi * power[i - 1];
}
// 调用检查函数,输出符合条件的前缀-后缀长度
check(len);
}
return 0;
}
代码解析
头文件与命名空间
#include<bits/stdc++.h>
using namespace std;
包含了所有标准库头文件,并使用 std
命名空间以简化后续代码中的标准库函数调用。
数据类型定义及全局变量
typedef unsigned long long ukr;
char s1[400002];
ukr jinzhi = 27;
ukr h1[400002];
ukr power[400002];
unsigned long long
类型用于处理大整数。s1
是字符数组,用于存储输入的字符串。h1
数组用于存储字符串的前缀哈希值。power
数组用于存储基数的幂次。jinzhi
设置为27,作为哈希计算的基础。
检查函数
void check(int len) {
for (int i = 1; i <= len; i++) {
if (h1[i] == h1[len] - h1[len - i] * power[i]) {
printf("%d ", i);
}
}
printf("\n");
}
该函数遍历所有可能的前缀长度 i
,并通过比较前缀和对应长度的后缀的哈希值来判断它们是否相等。如果相等,则输出该长度。
主函数
int main() {
while (scanf("%s", s1 + 1) != EOF) {
h1[0] = 0;
int len = strlen(s1 + 1);
for (int i = 1; i <= len; i++) {
h1[i] = jinzhi * h1[i - 1] + s1[i] - 'a' + 1;
}
power[0] = 1;
for (int i = 1; i <= len; i++) {
power[i] = jinzhi * power[i - 1];
}
check(len);
}
return 0;
}
输入循环
while (scanf("%s", s1 + 1) != EOF) {
逐行读取输入的字符串,直到文件结束符。
初始化哈希数组和计算字符串长度
h1[0] = 0;
int len = strlen(s1 + 1);
初始化哈希数组,并获取字符串的实际长度。
计算前缀哈希值
for (int i = 1; i <= len; i++) {
h1[i] = jinzhi * h1[i - 1] + s1[i] - 'a' + 1;
}
计算每个前缀的哈希值。
计算幂次数组
power[0] = 1;
for (int i = 1; i <= len; i++) {
power[i] = jinzhi * power[i - 1];
}
预计算基数的幂次,便于后续快速计算哈希值。
调用检查函数
check(len);
调用检查函数,输出所有既是前缀又是后缀的子串长度。
总结
这段代码通过利用哈希技术高效地解决了寻找字符串中既是前缀又是后缀的所有子串长度的问题。通过预计算哈希值和基数的幂次,能够快速验证任意两个子串是否相等,从而大大提高了算法效率。这种方法非常适合处理大规模数据输入的情况。