在信息科技高速发展的背景之下,海量数据已经让拥有者和管理者应接不暇,根据IDC发布的《数据时代2025》预测,全球数据圈(数据圈代表每年被创建、采集或是复制的数据集合)将从2018 年的32ZB增至2025年的175ZB。2018年,中国数据圈为7.6ZB,占全球的23.4%,预计2025年中国数据圈将增至48.6ZB,占全球27.8%,成为全球最大的数据圈。

海量数据是有“温度”的,按照被访问频率从高到低进行分类,可以将数据为热数据、温数据、冷数据。经常被访问的称为热数据,较少被访问的数据称为冷数据,处于中间状态的称为温数据。
热数据
热数据需要被计算节点频繁访问的在线类数据。
热数据因为访问频次需求大,效率要求高,所以就近计算和部署,数据缓存、在线存储、近线备份,以实现数据快速访问及高速处理。
温数据
温数据是非即时的状态和行为数据。如果整体数据量不大,也可以不区分温数据和热数据。
冷数据
一般很少变化的、长时间固定的数据或者属性,如:
· 过时的项目
· 日常记录和维护的数据
· 有关法律政策的数据
· 其他需要记录的数据
随着数据量的飞速增长,数据由“热”变“冷”现象也日益凸显,按照“二八定律”,经过一段时间的使用,80%以上的数据都会变成冷数据。从存储形式来说,

随着全球数据圈的飞速增长,冷数据的存储问题日益突出。热数据、温数据和冷数据根据访问频次划分,冷数据虽访问少,但价值可能随时间增加。为响应双碳目标,需要优化数据中心布局,提高能效,采用在线、近线、离线分级存储。数字罗塞塔计划致力于研发数字胶片、蓝光存储等冷数据存储技术,提供长期安全且绿色的解决方案。
最低0.47元/天 解锁文章
768

被折叠的 条评论
为什么被折叠?



