大力出奇迹——字符串哈希

字符串哈希详解

什么是字符串哈希

字符串哈希,即把字符串转化为一个 b a s e base base进制的数字

哈希的过程

把字符串a看做一个base进制的数字, 则a的每个前缀的哈希值为
h a s h [ i ] hash[i] hash[i] = = = ( h a s h [ i − 1 ] ∗ b a s e + a [ i ] ) % m o d (hash[i-1] * base + a[i]) \% mod (hash[i1]base+a[i])%mod
其中, b a s e base base m o d mod mod一般取质数,可以减小冲突
h a s h hash hash数组定义为无符号类型,可以不模,使其自然溢出
然鹅单哈希容易被卡,最好使用双哈希

双哈希

取不同的base和mod,做两次哈希,得到两组值: h a s h 1 [ ] , h a s h 2 [ ] hash1[], hash2[] hash1[],hash2[]
此时原串的哈希值为一个 p a i r pair pair
实测双哈希不会慢太多,可放心使用。

字符串哈希的用处

观察每个前缀串的哈希值可得:
h a s h [ l , r ] = h a s h [ r ] − h a s [ l − 1 ] ∗ b a s e r − l + 1 hash[l, r] = hash[r] - has[l-1]*base^{r-l+1} hash[l,r]=hash[r]has[l1]baserl+1(当hash不为无符号数时,减法后取模需 % m o d + m o d ) % m o d \%mod + mod) \% mod %mod+mod)%mod
于是可以 O ( 1 ) O(1) O(1)求得任意子串的哈希值。
简单的说,字符串哈希可以在字符串匹配的过程中,把两个字符串的比较转化为两个数字的比较,在时间上消掉一个 n n n

例题

题目链接
题意:两个串的最长公共子串
(听说后缀自动机能 O ( n ) O(n) O(n)求。晚点再补两份后缀数组 & & \&\& &&后缀自动机的代码。)

解法:

预处理出a和b每个前缀的哈希值
因为最长公共子串的性质,存在长度为 m m m的最长公共子串,就一定存在长度为 m − 1 m-1 m1的最长公共子串。
所以可以二分答案
check的时候,把a长度为m的所有子串的哈希值排序,对b的每个长度为m的哈希值,在有序序列中二分查找,能找到则check函数返回1。
时间复杂度:check里面一次排序 n l o g n nlogn nlogn, 二分答案 l o g n logn logn,一共 n l o g 2 n nlog^2n nlog2n
看到一种更好的做法 ,把check中排序+二分的操作换成哈希,可以再消掉一个 l o g log log
这里放一个双哈希的 n l o g 2 n nlog^2n nlog2n的代码。

#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
#include <vector>

using namespace std;

typedef unsigned long long ull;
typedef long long ll;
typedef pair<ull, ull> puu;
const int base1 = 31;
const int base2 = 196613;

puu has1[100005], has2[100005];
ull p1[100005], p2[100005];

void Hash(const string &a, puu has[])
{
    has[0] = {a[0], a[0]};
    int len = a.size();
    for (int i = 1; i < len; ++i)
    {
        has[i].first = has[i - 1].first * base1 + a[i];
        has[i].second = has[i - 1].second * base2 + a[i];
    }
}

puu sub(int l, int r, puu has[])
{
    if (!l)
        return has[r];
    puu ans;
    ans.first = has[r].first - has[l - 1].first * p1[r - l + 1];
    ans.second = has[r].second - has[l - 1].second * p2[r - l + 1];
    return ans;
}

ull lena, lenb;
vector<puu> h;

bool ok(int n, int lena, int lenb)
{
    h.clear();
    for (int i = n - 1; i < lena; ++i)
		h.push_back(sub(i-n+1, i, has1));
    sort(h.begin(), h.end());
    puu t;
    for (int i = n - 1; i < lenb; ++i)
    {
        t = sub(i - n + 1, i, has2);
        if (binary_search(h.begin(), h.end(), t))
            return 1;
    }
    return 0;
}

string a, b;

int main()
{
    cin >> a >> b;
    Hash(a, has1);
    Hash(b, has2);
    p1[0] = p2[0] = 1;
    for (int i = 1; i <= 100005; ++i)
    {
        p1[i] = base1 * p1[i - 1];
        p2[i] = base2 * p2[i - 1];
    }
    int l = 1, r = min(a.size(), b.size()), m;
    while (l <= r)
    {
        m = l + r >> 1;
        if (ok(m, a.size(), b.size()))
            l = m + 1;
        else
            r = m - 1;
    }
    cout << r;
    return 0;
}
**项目名称:** 基于Vue.js与Spring Cloud架构的博客系统设计与开发——微服务分布式应用实践 **项目概述:** 本项目为计算机科学与技术专业本科毕业设计成果,旨在设计并实现一个采用前后端分离架构的现代化博客平台。系统前端基于Vue.js框架构建,提供响应式用户界面;后端采用Spring Cloud微服务架构,通过服务拆分、注册发现、配置中心及网关路由等技术,构建高可用、易扩展的分布式应用体系。项目重点探讨微服务模式下的系统设计、服务治理、数据一致性及部署运维等关键问题,体现了分布式系统在Web应用中的实践价值。 **技术架构:** 1. **前端技术栈:** Vue.js 2.x、Vue Router、Vuex、Element UI、Axios 2. **后端技术栈:** Spring Boot 2.x、Spring Cloud (Eureka/Nacos、Feign/OpenFeign、Ribbon、Hystrix、Zuul/Gateway、Config) 3. **数据存储:** MySQL 8.0(主数据存储)、Redis(缓存与会话管理) 4. **服务通信:** RESTful API、消息队列(可选RabbitMQ/Kafka) 5. **部署与运维:** Docker容器化、Jenkins持续集成、Nginx负载均衡 **核心功能模块:** - 用户管理:注册登录、权限控制、个人中心 - 文章管理:富文本编辑、分类标签、发布审核、评论互动 - 内容展示:首页推荐、分类检索、全文搜索、热门排行 - 系统管理:后台仪表盘、用户与内容监控、日志审计 - 微服务治理:服务健康检测、动态配置更新、熔断降级策略 **设计特点:** 1. **架构解耦:** 前后端完全分离,通过API网关统一接入,支持独立开发与部署。 2. **服务拆分:** 按业务域划分为用户服务、文章服务、评论服务、文件服务等独立微服务。 3. **高可用设计:** 采用服务注册发现机制,配合负载均衡与熔断器,提升系统容错能力。 4. **可扩展性:** 模块化设计支持横向扩展,配置中心实现运行时动态调整。 **项目成果:** 完成了一个具备完整博客功能、具备微服务典型特征的分布式系统原型,通过容器化部署验证了多服务协同运行的可行性,为云原生应用开发提供了实践参考。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值