哈希表应用之字符子串统计

该博客探讨了一种利用哈希表解决字符串问题的方法,具体是统计给定字符串中长度为n的不同子串数量。题目限制子串总数不超过16,000,000,通过将字符映射为nc进制数值,可以高效地进行计数。" 132572819,19671515,使用R语言geom_text_repel解决数据点标签重叠问题,"['R语言', '信息可视化', '数据分析']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  问题描述:给出一个字符串,包含nc个不同字符组成,求这个字符串中长度为n的子串(不包括重复的)的数量。题目中假设字串数目不超过16 000 000 个。输入第一行包含两个数字n ,nc,第二行输入字符串。输出符合要求的子串个数。

       输入: 

              3  4

              daababac

       输出:

              5

题目中所说的字符串字符个数为nc,则可以将其所有长度为n的字符串Hash为nc进制的整数。首先要处理的是给nc个不同字符Hash一个值;


#include<iostream>
#include<string>
using namespace std;
#define Size 16000003
string s;
bool Hash[Size];          //记录是否出现
int Id[500];             //记录每个字符表示的数字
int main(){
	int n, nc, i,j,pos,ans;
	while (cin>>n>>nc>>s){
		ans = 0;
		memset(Id, -1, sizeof(Id));               //统一标记为-1
		for (i = 0; i < s.size() && ans < nc; i++){
			if (Id[s[i]] != -1)
				continue;                        //已有值
			Id[s[i]] = ans++;                  //赋值
		}
		/*以上给nc种不同的字符串赋值*/
		memset(Hash, false, sizeof(Hash));   //初始化
		ans = 0;
		for (i = 0; i < s.size()-n+1; i++){
			pos = 0;
			for (j = i; j < i + n; j++)
				pos = pos*nc + Id[s[j]];           //计算位置
			if (!Hash[pos]){       //若不存在
				ans++;
				Hash[pos] = true;
			}
		}
		cout << ans << endl;
	}
	return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值