influxdb知识总结(3)

最新推荐文章于 2025-11-04 17:21:33 发布

原创最新推荐文章于 2025-11-04 17:21:33 发布 · 481 阅读

0 ·

CC 4.0 BY-SA版权

存储专栏收录该内容

6 篇文章

订阅专栏

本文深入探讨InfluxDB的高效时序数据管理机制，包括TSM文件如何实现数据的快速写入与压缩，以及内存索引和磁盘索引的结构与作用。解析InfluxDB如何克服内存索引的局限，通过Disk-BasedIndex确保数据持久化。

部署运行你感兴趣的模型镜像

influxdb比较核心的内容大致分为两个部分：
1 TSM文件实现时序数据高效率写入与压缩，其提供的文件级别的B+树索引可以有效提高根据serieskey查找时间序列的性能
2 Influxdb还实现了内存索引****(Memory-Based Index)以及文件索引****(Disk-Based Index)。

Memory-Based Index

内存索引主要涉及这两个结构：

// tagkey -> seriesID
seriesByTagKeyValue: map<tagkey, map<tagValue, List< seriesID > > > 
// seriesID -> seriesKey
seriesByID: map< seriesID,  *series>

Disk-Based Index

内存索引存在天然缺陷：
1 受限于内存大小，无法支持大量的series key；
2 一旦influxdb进程挂掉，需要扫描所有psm文件来恢复索引信息；
因此设计了Disk-Based Index，将索引信息持久到磁盘中，使用时再进行加载。
influxdb中对倒排索引与时序数据的存储都使用了相同的存储机制——LSM，Disk-Based Index 的结构如下：
在这里插入图片描述
参考：
influxdb数据读取
 influxdb倒排索引
 influxdb数据写入