Hash(哈希)——解决字符串问题

本文介绍了字符串Hash的基本概念,通过将字符串映射为整数,实现快速比较和查找。文章详细阐述了如何计算字符串及其子串的Hash值,并讨论了减少冲突的方法,包括选择合适的素数p和mod值。同时,提到了三种常见的字符串Hash计算方法,适用于不同的场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关于字符串Hash:把字符串有效转化为一个整数

把每个字符串有效地、唯一的映射到每个"不同"的整数,就可以很好地处理字符串;

找到一个Hash函数,使得每一个字符串都能够映射到一个整数上;

hash[i] = ( hash[i-1] * p + idx(s[i]) )%mod;

字符串:abc, bbc, aba, aadaabac    字符串下标从0开始,  先把a映射为1, b映射为2,c为3,d为4;

即 idx(a) = 1,  idx(b) = 2,  idx(c) = 3,  idx(d) = 4; //  idx 为字符串的字符的编号;

假设 p = 13, mod = 101; 先把abc映射为一个整数, 

hash[0] = 1, // 表示a的映射为1;

hash[1] = ( hash[0]*p+idx(b) )%mod = ( 1*13+2 )%101 =15; //表示ab的映射为15;

hash[2] = ( hash[1]*p+idx(c) )%mod = ( 15*13+3)%101 = 97; //表示abc的映射为97;


用同样的方法,我们可以把 bbc,aba,aadaabac 都映射为整数;

用同样的hash函数,得到如下结果:

abc ~ 97, bbc ~ 64, aba ~ 95, aadaabac ~ 35;

可以发现这是一个 字符串到整数的映射;

这样,我们就可以记录下每个字符串对应的整数,当下一次出现了一个已经出现过的字符串时,查询整数是否出现过,就可以知道

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值