什么是 LSM 思想？它的优缺点都那些？

最新推荐文章于 2025-04-19 00:43:54 发布

原创最新推荐文章于 2025-04-19 00:43:54 发布 · 1.1k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#LSM #数据库 #架构设计

Clickhouse 同时被 2 个专栏收录

4 篇文章

订阅专栏

4 篇文章

订阅专栏

LSM（Log-StructuredMerge）是一种存储系统设计，通过日志结构、多层次存储和定期合并优化性能。它在写入密集场景表现出色，尤其适合顺序读取和大规模数据存储，但随机读取和写放大是其潜在缺点。

LSM（Log-Structured Merge）是一种用于设计和优化存储系统的思想和架构。它最初由闪存文件系统（Flash File System）和大规模分布式存储系统（如 Bigtable 和 HBase）采用，并在键值存储引擎中广泛应用，如 LevelDB 和 RocksDB。

LSM 核心思想如下：

日志结构：数据以追加日志的方式写入磁盘。每次写操作都会追加到日志文件的末尾，而不是原地更新。这样可以避免频繁的随机写入，提高写入性能。
多层次存储：数据在磁盘上组织为多个层次的结构，通常包括内存、磁盘和归档层。数据首先写入内存中，然后定期合并到磁盘层，最终可能归档到长期存储。
合并操作：为了保持查询性能，LSM 树会定期执行合并操作，将多个小的数据块合并为一个更大的块。这有助于减少数据冗余和提高查询性能。
顺序读写：由于数据追加写入磁盘，读取操作通常是顺序读取。这种设计非常适合旋转硬盘和闪存，因为它减少了寻道时间，提高了读取性能。

LSM 树的主要优势包括：

高写入性能：由于数据以日志形式追加写入，LSM 树能够提供非常高的写入吞吐量。
顺序读取性能：数据的组织方式使得顺序读取非常高效，适用于扫描大量数据的操作。
高度可扩展：LSM 树适用于大规模数据存储，可以轻松扩展到非常大的数据集。

LSM 树的缺点包括：

读取较慢：对于随机读取操作，性能可能较差，因为数据分布在多个层次和文件中。
写放大：由于数据合并和维护多个层次，写入操作可能会引起写放大，即写入的数据量可能比实际数据大。

总结来说，LSM 树是一种在写入密集型工作负载下非常高效的存储引擎设计，但它也适用于大规模数据存储和高吞吐量的读取操作。在选择存储系统时，LSM 树的特性和优势应该根据具体的应用需求来考虑。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

天河书阁 VicRestart 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。