大家好,上期经过了王宏志教授对数据库前沿领域的介绍,不知道小伙伴们是否对数据库领域有了更深的认识呢,本期让我们回归时序数据库,再来聊一聊时序数据库在水电站领域的应用。
本文仅代表个人观点,如有偏颇之处,还请海涵~
传统水电站监控系统迎挑战
在水电站的自动化控制过程中,电站的运行数据监控系统举足轻重。其后期为运行分析、趋势判断和事故处理等提供了有力的保障。水电站监控的数据具有采集频次高、并呈现时间序列排序等特点,使用传统的RDB(诸如MySQL、SQL Server、Oracle等)存储带来了诸多的问题。
首先,其存储成本高,写入吞吐低。大型水电站的测点非常之大,即使只是1万个测点,如果每秒采集一次,一天也要占用大约10 ~ 20 GB的磁盘存储空间。普通的磁盘阵列的容量很难满足上述海量数据的存储需求,而且关系型数据库对时序数据的压缩不理想,这也就造成伴随时间推移,其成本还将不断上升。此外,在传统方案下,海量数据写入耗时较长,难以满足千万级的写入需求。
其次,查询性能差。虽然会对关系型数据库进行分库分表、优化索引等技术操作,但随着存储数据的不断增长,其查询效率还是会显著降低,难以在秒级甚至毫秒级获取所需要的数据。同时,分表策略也会增加查询业务的复杂性。比如,如果按月分表,那么查询跨月数据需要通过多条SQL或联合查询才能获得所需结果。
时序数据库解决传统数据库瓶颈
针对水电厂监控系统中存储的数据大部分是时序数据的特点,基于时序数据库搭建水电站的监控系统成为了更好的选择。相比于关系型数据库,时序数据库在数据存储和查询方面,都有明显的性能优势。
时序数据库的高效压缩比可以节省大量的存储空间