InfluxDB 2.0 原理与应用实践

最新推荐文章于 2025-09-11 03:12:10 发布

原创

最新推荐文章于 2025-09-11 03:12:10 发布 · 1.2k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#ios #iphone #功能测试 #测试用例

本文介绍了时序数据库InfluxDB的原理与应用，特别是InfluxDB 2.0的特点，包括高并发写入、多维度查询。详细讲解了TICK架构以及InfluxDB的存储机制，如TSM存储引擎。此外，还展示了如何通过Telegraf收集系统数据并使用Flux在Python中进行查询，以及如何利用Jmeter搭建性能监控环境。

什么是时序数据库

时序数据库，全称时间序列数据库（Time Series Database，TSDB），用于存储大量基于时间的数据，时序数据（Time Series Data）指的是一系列基于时间的数据，例如CPU利用率，北京的房价变化趋势，某一地区的温度变化等。

时序数据库支持时序数据的快速写入、持久化，多维度查询、聚合等操作，同时可以记录所有的历史数据，查询时将时间作为数据的过滤条件。

时序数据的使用场景广泛，包括DevOps监控，应用程序指标，IoT传感器数据，实时动态数据分析等场景。

初识InfluxDB

InfluxDB是时序数据库中应用比较广泛的一种，在DB-Engines TSDB rank中位居首位，可见InfluxDB在互联网的受欢迎程度是非常高的。下图是截止到2021年8月时序数据库的排名情况。

1056×471 78.7 KB

它是go语言开发的数据库，InfluxDB自发布至今，已经有两个版本，InfluxDB1.x系列提供一种类似SQL的查询语言InfluxQL，用于数据交互。2019年1月新推出的influxDB2.0 alpha版本，主推全新的查询语言Flux，支持TICK架构。在 2020 年底推出InfluxDB 2.0 正式版本，该版本又分为InfluxDB Cloud 和 InfluxDB OSS两个系列。

时序数据库与我们熟悉的关系型数据库有所不同，首先需要了解一下InfluxDB中字段的含义，如下图所示：

1080×549 128 KB

TICK架构分析与各组件功能介绍

TICK架构是 InfluxData 平台的组件的集合首字母缩写，该集合包括Telegraf、InfluxDB、Chronograf和 Kapacitor。TICK架构以及各组件分工情况如图所示：

1052×594 20.8 KB

除了上图可视化管理工具Chronograf外，还有一种可视化工具Grafana，它也是用于大规模指标数据的可视化展示，提供包括折线图，饼图，仪表盘等多种监控数据可视化UI，若应用过程中考虑到扩展性问题，也会使用Grafana代替Chronograf。

InfluxDB的特点

● 数据写入：

①. 高并发高吞吐，可持续的数据写入。

②. 写多读少，时序数据95%以上都是写操作，例如在监控系统数据的时候，监控数据特别多，但是通常只会关注几个关键指标。

③. 数据实时写入，不支持数据更新，但是可以人为更新修改。

● 数据分析与查询：

①. 数据查询是按照时间段读取，例如1小时，1分钟，给出具体时间范围。

②. 最近的数据读取率高，越旧的数据读取率越低。

③. 多种精度查询和多种维度分析。

● 数据存储：

①. 存储数据规模大的数据，监控数据的数据大多数情况下都是TB或者PB级。

②. 数据存放具有时效性，InfluxDB提供了保存策略，可以认为是数据的保质期，超过周期范围，就可以认为数据失效，需要回收。节约存储成本，清理低价值的数据。

InfluxDB存储原理

InfluxDB的存储结构树是时间结构合并树（Time-Structured Merge Tree，TSM），它是由日志结构化合并树（Log-Structured Merge Tree，LSM），根据实际需求变化而来的。

**①. LSM树 **

LSM树包含三部分：Memtable，Immutable和SSTable。MemTable是内存中的数据结构，用于保存最近产生的数据，并按照Key有序地组织数据。内存并不是可靠存储，若断电就会丢失数据，因此通常会使用预写式日志(Write-ahead logging，WAL)的方式来保证数据的可靠性。

最低0.47元/天解锁文章