InfluxDB 时序数据库入门

最新推荐文章于 2025-10-05 22:50:06 发布

原创最新推荐文章于 2025-10-05 22:50:06 发布 · 358 阅读

CC 4.0 BY-SA版权

文章标签：

10 篇文章

订阅专栏

InfluxDB是一款开源的分布式时序数据库，适用于性能监控、应用程序指标、物联网传感器数据及实时分析等场景。它支持高并发写入，具备数据压缩存储、低查询延时等特点。本文深入解析InfluxDB的概念、架构、特性及应用场景。

influxdb是一个开源分布式时序、时间和指标数据库，使用 Go 语言编写，无需外部依赖。其设计目标是实现分布式和水平伸缩扩展，是InfluxData 的核心产品。
应用：性能监控，应用程序指标，物联网传感器数据和实时分析等的后端存储。
influxdb 完整的上下游产业还包括：Chronograf、Telegraf、Kapacitor

TSM是在LSM的基础上优化改善的，引入了serieskey的概念，对数据实现了很好的分类组织。
TSM主要由四个部分组成： cache、wal、tsm file、compactor：

cache：插入数据时，先往 cache 中写入再写入wal中，可以认为 cache 是 wal 文件中的数据在内存中的缓存，cache
中的数据并不是无限增长的，有一个 maxSize 参数用于控制当 cache 中的数据占用多少内存后就会将数据写入 tsm 文件。
wal：预写日志，对比MySQL的 binlog，其内容与内存中的 cache 相同，作用就是为了持久化数据，当系统崩溃后可以通过 wal
文件恢复还没有写入到 tsm 文件中的数据，当 InfluxDB 启动时，会遍历所有的 wal 文件，重新构造 cache。
tsm file：每个 tsm 文件的大小上限是 2GB。当达到
cache-snapshot-memory-size,cache-max-memory-size 的限制时会触发将 cache 写入 tsm 文件。
compactor：主要进行两种操作，一种是 cache 数据达到阀值后，进行快照，生成一个新的 tsm 文件。另外一种就是合并当前的 tsm 文件，将多个小的 tsm 文件合并成一个，减少文件的数量，并且进行一些数据删除操作。