新一代日志型系统在 SOFAJRaft 中的应用

本文介绍了基于SOFAJRaft的高性能Java日志系统改进，移除对RocksDB的依赖，设计了纯Java的索引模块，涉及内存映射、文件管理、组提交和预分配技术，旨在提升存储性能和代码可读性。

在这里插入图片描述

📄

文｜黄章衡（SOFAJRaft 项目组）

福州大学 19 级计算机系

研究方向｜分布式中间件、分布式数据库

Github 主页｜https://github.com/hzh0425

校对｜冯家纯（SOFAJRaft 开源社区负责人）

本文 9402 字阅读 18 分钟

▼

PART. 1 项目介绍

1.1 SOFAJRaft 介绍

SOFAJRaft 是一个基于 RAFT 一致性算法的生产级高性能 Java 实现，支持 MULTI-RAFT-GROUP，适用于高负载低延迟的场景。使用 SOFAJRaft 你可以专注于自己的业务领域，由 SOFAJRaft 负责处理所有与 RAFT 相关的技术难题，并且 SOFAJRaft 非常易于使用，你可以通过几个示例在很短的时间内掌握它。

Github 地址：

https://github.com/sofastack/sofa-jraft

1.2 任务要求

**目标：*当前 LogStorage 的实现，采用 index 与 data 分离的设计，我们将 key 和 value 的 offset 作为索引写入 rocksdb，同时日志条目（data）*写入 Segment Log。因为使用 SOFAJRaft 的用户经常也使用了不同版本的 rocksdb，这就要求用户不得不更换自己的 rocksdb 版本来适应 SOFAJRaft，所以我们希望做一个改进：移除对 rocksdb 的依赖，构建出一个纯 Java 实现的索引模块。

PART. 2 前置知识

Log Structured File Systems

如果学习过类似 Kafka 等消息队列的同学，对日志型系统应该并不陌生。

如图所示，我们可以在单机磁盘上存储一些日志型文件，这些文件中一般包含了旧文件和新文件的集合。区别在于 Active Data File 一般是映射到内存中的并且正在写入的新文件*(基于 mmap 内存映射技术)*，而 Older Data File 是已经写完了，并且都 Flush 到磁盘上的旧文件，当一块 Active File 写完之后，就会将其关闭，并打开一个新的 Active File 继续写。