MyBatis + Redis二级缓存整合实战（架构师都在用的缓存方案）

原创于 2025-12-05 08:49:17 发布 · 428 阅读

11 ·

CC 4.0 BY-SA版权

第一章：MyBatis 的缓存机制

MyBatis 提供了强大的缓存机制，旨在提升数据库查询效率，减少频繁访问数据库带来的性能开销。缓存分为一级缓存和二级缓存，两者作用范围和生命周期不同，合理使用可显著优化系统性能。

一级缓存

一级缓存是 SqlSession 级别的缓存，默认开启。在同一个 SqlSession 中，执行相同的 SQL 查询时，MyBatis 会从缓存中直接返回结果，而不会再次访问数据库。

// 示例：一级缓存生效场景
SqlSession sqlSession = sqlSessionFactory.openSession();
UserMapper mapper = sqlSession.getMapper(UserMapper.class);

User user1 = mapper.selectUserById(1); // 第一次查询，访问数据库
User user2 = mapper.selectUserById(1); // 第二次查询，从一级缓存获取

sqlSession.close(); // 缓存随之清空

当 SqlSession 关闭或调用 clearCache() 方法时，一级缓存将被清空。

二级缓存

二级缓存是 Mapper 级别的缓存，多个 SqlSession 可共享同一缓存数据。需手动开启，并要求返回的实体类实现 Serializable 接口。配置步骤如下：

在 MyBatis 配置文件中启用二级缓存：
```
<setting name="cacheEnabled" value="true"/>
```
在 Mapper XML 文件中添加 <cache/> 标签：

<mapper namespace="com.example.UserMapper">
  <cache eviction="LRU" flushInterval="60000" size="512" readOnly="true"/>
  <select id="selectUserById" resultType="User">
    SELECT * FROM users WHERE id = #{id}
  </select>
</mapper>

属性	说明
eviction	回收策略，如 LRU、FIFO
flushInterval	刷新间隔（毫秒）
size	最大缓存条数
readOnly	是否只读，若为 true 则返回对象实例共享

graph TD A[客户端请求] --> B{SqlSession 是否存在相同查询?} B -->|是| C[从一级缓存返回结果] B -->|否| D{是否启用二级缓存?} D -->|是| E{二级缓存是否存在数据?} E -->|是| F[从二级缓存返回] E -->|否| G[查询数据库并写入缓存] D -->|否| G

第二章：一级缓存原理与应用实践

2.1 一级缓存的生命周期与作用域解析

一级缓存通常绑定于会话（Session）级别，其生命周期与会话实例完全一致。一旦会话创建，缓存即被初始化；会话关闭时，缓存随之销毁。

作用域特征

该缓存的作用域局限于单个会话内，不同会话之间无法共享一级缓存数据，从而保证数据隔离性与事务边界清晰。

典型应用场景

在同一个会话中执行多次相同查询时，一级缓存可避免重复数据库访问，提升性能。


SqlSession session = sqlSessionFactory.openSession();
User user1 = session.selectOne("selectUser", 1); // 查询数据库
User user2 = session.selectOne("selectUser", 1); // 命中缓存
session.close(); // 缓存销毁

上述代码中，第一次查询触发数据库操作，结果存入一级缓存；第二次请求相同数据时直接从缓存获取，无需再次访问数据库。session关闭后，缓存自动清理，确保资源释放与数据一致性。

2.2 SqlSession 级别缓存的触发条件与限制

缓存触发的基本条件

SqlSession 级别缓存（一级缓存）默认开启，其生效需满足以下条件：

同一 SqlSession 实例中执行查询
相同的 SQL 语句和参数
相同的 Statement ID
中间未执行过任何增删改操作

缓存失效的典型场景

当发生以下操作时，一级缓存将被清空：

<select id="selectUser" resultType="User">
  SELECT * FROM user WHERE id = #{id}
</select>

执行上述查询后，若调用 sqlSession.insert("insertUser", user)，则后续相同查询将绕过缓存，直接访问数据库。

并发与事务的影响

一级缓存基于 SqlSession 实例隔离，不同会话之间无法共享数据。在高并发或分布式环境下，可能引发数据不一致问题，需结合数据库事务隔离级别谨慎使用。

2.3 一级缓存失效场景深度剖析

事务边界导致的缓存失效

MyBatis 的一级缓存默认基于 SqlSession 生命周期，当事务提交或回滚后，SqlSession 被关闭，缓存随之清空。跨事务操作无法共享缓存数据。

数据同步机制

在高并发环境下，若多个线程持有独立的 SqlSession，彼此之间的一级缓存无法同步，容易出现脏读。例如：


SqlSession session1 = sqlSessionFactory.openSession();
UserMapper mapper1 = session1.getMapper(UserMapper.class);
mapper1.selectUserById(1); // 查询结果存入 session1 缓存

SqlSession session2 = sqlSessionFactory.openSession();
UserMapper mapper2 = session2.getMapper(UserMapper.class);
mapper2.updateUser(new User(1, "updated")); // 修改数据
session2.commit(); // 提交事务，但 session1 缓存未更新

mapper1.selectUserById(1); // 仍从旧缓存返回，导致数据不一致

上述代码中，session1 无法感知 session2 的数据变更，造成缓存失效场景下的数据偏差。一级缓存仅适用于单会话内读多写少的场景。

2.4 基于实际案例验证一级缓存效果

在典型的电商系统中，用户频繁查询商品详情，使用 MyBatis 一级缓存可显著减少数据库压力。以下为基于 SqlSession 的查询示例：


SqlSession session = sqlSessionFactory.openSession();
ProductMapper mapper = session.getMapper(ProductMapper.class);

// 第一次查询
Product p1 = mapper.selectById(1001);
System.out.println(p1.getName()); // 输出：iPhone 15

// 同一 SqlSession 内第二次查询
Product p2 = mapper.selectById(1001);
System.out.println(p1 == p2); // 输出：true

上述代码中，两次调用 selectById(1001) 并未触发两次 SQL 查询。MyBatis 在一级缓存中命中了第一次查询结果，因此 p1 == p2 返回 true，表明对象来自同一缓存实例。

缓存生命周期与作用域

一级缓存默认开启，作用域为 SqlSession 级别。其生命周期与 SqlSession 绑定，在以下情况会被清空：

执行 insert、update 或 delete 操作后
手动调用 clearCache()
SqlSession 关闭或提交后

2.5 一级缓存的调试与性能监控技巧

在开发过程中，合理调试一级缓存并监控其性能表现，是保障系统响应速度的关键环节。通过启用缓存日志输出，可实时观察缓存命中与失效行为。

启用调试日志

logging:
  level:
    org.hibernate.cache: DEBUG
    org.springframework.orm.jpa: TRACE

该配置开启Hibernate一级缓存相关日志，便于追踪实体加载与缓存命中情况。DEBUG级别输出缓存操作，TRACE级别显示更细粒度的JPA交互流程。

关键监控指标

指标名称	说明
Hit Count	缓存命中次数，越高代表复用效果越好
Miss Count	未命中次数，突增可能预示数据访问模式变化

第三章：二级缓存架构设计与核心原理

3.1 二级缓存的整体工作机制与执行流程

二级缓存是介于一级缓存和持久化存储之间的共享缓存层，多个会话可共用同一份缓存数据，有效降低数据库访问压力。

工作流程概述

当执行查询时，系统首先检查二级缓存中是否存在目标数据；若命中则直接返回，否则继续访问数据库，并将结果写入二级缓存供后续请求使用。

缓存更新机制

在数据变更（如更新、删除）操作提交时，对应缓存条目将被自动清除，确保下次读取时重新加载最新数据。


@CacheNamespace(usage = MybatisCache.class)
public interface UserMapper {
    @Select("SELECT * FROM users WHERE id = #{id}")
    User findById(Long id);
}

上述代码启用MyBatis的二级缓存功能，通过@CacheNamespace注解声明缓存策略，所有该Mapper下的查询将自动参与缓存读写。

3.2 Cache 接口体系与默认实现分析

在 Go 的缓存设计中，Cache 接口定义了基本的数据访问契约，包括 Get、Put 和 Delete 方法。该接口支持多种后端实现，如内存缓存、Redis 等。

核心方法定义

type Cache interface {
    Get(key string) (interface{}, bool)
    Put(key string, value interface{})
    Delete(key string)
}

其中，Get 返回值和是否存在标志，避免 nil 值歧义；Put 采用覆盖语义；Delete 保证幂等性。

默认实现：内存缓存

默认的 MemoryCache 使用 sync.Map 实现线程安全：

读写分离，提升并发性能
无自动过期机制，需外部轮询清理
适用于小规模、高频读场景

实现	线程安全	持久化
MemoryCache	是	否
RedisCache	依赖客户端	是

3.3 开启二级缓存的配置策略与最佳实践

启用二级缓存的基本配置

在 MyBatis 中开启二级缓存需在映射文件中添加 <cache/> 标签：

<cache eviction="LRU" flushInterval="60000" size="512" readOnly="false"/>

其中，eviction 指定淘汰策略（LRU 表示最近最少使用），flushInterval 设置刷新间隔（单位毫秒），size 控制缓存最大条目数，readOnly 决定是否返回只读对象。

缓存策略选择建议

对于读多写少的数据，推荐使用二级缓存以降低数据库压力；
涉及频繁更新的表应禁用缓存，避免脏数据风险；
可结合 Redis 等外部缓存实现跨 JVM 共享，提升分布式环境一致性。

第四章：MyBatis 与 Redis 集成实战

4.1 Redis 作为第三方缓存提供者的集成方案

在现代分布式系统中，Redis 因其高性能和丰富的数据结构被广泛用作第三方缓存提供者。通过将其集成到应用架构中，可显著降低数据库负载并提升响应速度。

连接配置与客户端选择

推荐使用成熟的客户端库如 Jedis 或 Lettuce（Java 环境下）。以 Lettuce 为例：


RedisClient redisClient = RedisClient.create("redis://localhost:6379");
StatefulRedisConnection<String, String> connection = redisClient.connect();
RedisCommands<String, String> syncCommands = connection.sync();

上述代码创建了一个线程安全的连接实例，适用于高并发场景。Lettuce 支持异步和响应式编程模型，能更好利用系统资源。

缓存策略配置

通过设置 TTL 和最大内存策略，保障缓存有效性与系统稳定性：

maxmemory 2gb：限制 Redis 内存使用上限
maxmemory-policy allkeys-lru：启用 LRU 淘汰机制

合理配置哨兵或集群模式，可实现高可用与横向扩展。

4.2 自定义 Cache 实现类整合 Redis 客户端

在构建高并发系统时，自定义缓存实现可精准控制数据访问策略。通过整合 Redis 客户端（如 Go 中的 `go-redis`），可封装统一的缓存接口。

核心接口设计

定义通用 Cache 接口，便于后续扩展：

type Cache interface {
    Get(key string) (string, error)
    Set(key string, value string, expiration time.Duration) error
    Delete(key string) error
}

该接口抽象基础操作，支持未来替换为本地缓存或多级缓存架构。

Redis 实现细节

使用 `go-redis` 实现实例方法：

type RedisCache struct {
    client *redis.Client
}

func (r *RedisCache) Set(key string, value string, exp time.Duration) error {
    return r.client.Set(context.Background(), key, value, exp).Err()
}

Set 方法调用 Redis 的 SET 命令，设置键值对及过期时间，确保数据最终一致性。

初始化与依赖注入

通过构造函数注入客户端配置，提升可测试性与灵活性。

4.3 缓存穿透、雪崩问题的应对策略实现

缓存穿透：无效查询的防御机制

缓存穿透指大量请求访问不存在的数据，导致每次请求都击穿缓存直达数据库。解决方案之一是使用布隆过滤器预先判断数据是否存在。


// 使用布隆过滤器拦截无效键
bloomFilter := bloom.NewWithEstimates(100000, 0.01)
bloomFilter.Add([]byte("existing_key"))

if !bloomFilter.Test([]byte("nonexistent_key")) {
    return errors.New("key does not exist")
}

该代码初始化一个可容纳10万元素、误判率1%的布隆过滤器，有效拦截非法查询，降低后端压力。

缓存雪崩：失效风暴的缓解策略

当大量缓存同时过期，可能引发雪崩。采用差异化过期时间可分散压力：

基础过期时间 + 随机值（如 30分钟 ~ 2小时）
热点数据设置永不过期，通过后台任务异步更新

4.4 分布式环境下缓存一致性保障机制

在分布式系统中，缓存一致性是确保多个节点间数据视图统一的关键挑战。当数据在某一节点更新时，其他节点的缓存必须及时感知并同步变更，否则将导致脏读或数据不一致。

常见一致性策略

写穿透（Write-Through）：写操作同时更新缓存与数据库，保证数据一致性；
写回（Write-Back）：先更新缓存并标记为脏，异步刷新到数据库，性能高但有丢失风险；
失效策略（Cache-Invalidate）：更新数据库后主动使其他节点缓存失效。

基于消息队列的数据同步机制

使用消息中间件广播缓存变更事件，各节点监听并作出响应：


type CacheEvent struct {
    Key   string `json:"key"`
    Op    string `json:"op"` // "set", "delete"
}

// 消费消息并更新本地缓存
func handleEvent(event *CacheEvent) {
    switch event.Op {
    case "set":
        localCache.Set(event.Key, fetchFromDB(event.Key))
    case "delete":
        localCache.Delete(event.Key)
    }
}

该机制通过解耦更新源与缓存节点，实现最终一致性，适用于读多写少场景。配合版本号或时间戳可进一步避免消息乱序导致的问题。

第五章：总结与展望

技术演进的持续驱动

现代软件架构正加速向云原生演进，微服务、Serverless 与边缘计算的融合已成为主流趋势。以 Kubernetes 为核心的编排系统不仅支撑了弹性伸缩，还通过 CRD（自定义资源定义）实现了领域特定语言的扩展能力。

服务网格 Istio 提供了细粒度的流量控制与可观测性支持
OpenTelemetry 统一了分布式追踪、指标与日志的数据模型
GitOps 模式使 CI/CD 更加安全且可审计

代码即基础设施的实践深化


// 示例：使用 Terraform 的 Go SDK 动态创建 AWS S3 存储桶
package main

import (
    "github.com/hashicorp/terraform-exec/tfexec"
)

func createBucket() error {
    tf, _ := tfexec.NewTerraform("/path/to/code", "/path/to/terraform")
    if err := tf.Init(); err != nil {
        return err
    }
    return tf.Apply()
}

该模式已在某金融客户灾备系统中落地，实现跨多云环境的自动资源配置，部署时间从小时级缩短至分钟级。

未来挑战与应对方向

挑战	应对方案	案例场景
多集群配置漂移	ArgoCD + Kustomize 声明式同步	跨国电商大促前环境一致性校验
AI 模型推理延迟高	基于 KEDA 的事件驱动自动扩缩容	实时图像识别服务负载突增响应

[用户请求] → [API Gateway] → [Auth Service]
                     ↓
             [Rate Limit Check]
                     ↓
       [Event Queue → Worker Pool]