热冷算法：热冷数据分析应用及解决方案

Freedom3568

已于 2022-06-28 20:40:04 修改

阅读量624

点赞数

CC 4.0 BY-SA版权

分类专栏：数据中台文章标签：数据库 database

于 2022-06-01 15:49:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/zhanggqianglovec/article/details/125084210

数据中台专栏收录该内容

94 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了数据库冷热分离的概念，适用于表数据量大、读写速度慢的情况。文章详细阐述了如何判断和触发冷热数据，包括LRU和Hierarchical + Randomized方法，并讨论了冷热数据分离的实现思路，如一致性、数据量和并发性处理。此外，还提到了冷热数据的使用场景和整体解决方案，以及存在的不足。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

一、简介

工作中，随着数据库表数据量的增大，我们会发现，对表数据的读写操作会变得越来越慢，有时候查询一条数据会耗费几十秒或几分钟才查出结果，甚至多点击几次查询还会出现宕机。

这个时候，我们可能首先会想到通过对表结构、业务代码、索引、SQL语句等方面进行优化，以此来提高读写操作响应速度。然而，对于表数据量相对较大的情况，我们发现优化效果有限，并未达到预期效果。

此时，我们可以考虑是否可以通冷热分离来提升读写、查询效率。

二、概念

为了更好的理解冷热分离的概念，我们先了解下什么是热数据，什么是冷数据。

热数据指的是需要即时对用户进行分发的数据，即从数据源抓取之后经过数据处理，需要即时存储到可快速分发的存储介质供API或直接面向用户的系统使用。
热数据需要重点保障服务质量和稳定性，为了保证数据的时效性，在数据处理上也是优先级高的数据。

冷数据指的是不需要即时发给用户的数据。
这些数不会原样分发给用户，它们需要经过长期的积累，使我们可以从中得到基于此更高层次的分析。

冷热分离指的是在处理数据时将数据库分为冷库和热库，冷库指用于存放走到了终态的数据（冷数据）的数据库，热库用于存放还需要修改的数据（热数据）的数据库。

三、场景

从冷热分离的定义我们可以知道当业务需求涉及到冷热数据，表数据量增长速度快或数据量较大时，我们就该考虑是否使用冷热分离解决方案了。比如：

数据走到终态后，只有读没有写的需求。
用户

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Freedom3568 技术域不存在英雄主义，不进则退

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。