📕我是廖志伟,一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》(基础篇)、(进阶篇)、(架构篇)清华大学出版社签约作家、Java领域优质创作者、优快云博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。
📘拥有多年一线研发和团队管理经验,研究过主流框架的底层源码(Spring、SpringBoot、SpringMVC、SpringCloud、Mybatis、Dubbo、Zookeeper),消息中间件底层架构原理(RabbitMQ、RocketMQ、Kafka)、Redis缓存、MySQL关系型数据库、 ElasticSearch全文搜索、MongoDB非关系型数据库、Apache ShardingSphere分库分表读写分离、设计模式、领域驱动DDD、Kubernetes容器编排等。不定期分享高并发、高可用、高性能、微服务、分布式、海量数据、性能调优、云原生、项目管理、产品思维、技术选型、架构设计、求职面试、副业思维、个人成长等内容。
🌾阅读前,快速浏览目录和章节概览可帮助了解文章结构、内容和作者的重点。了解自己希望从中获得什么样的知识或经验是非常重要的。建议在阅读时做笔记、思考问题、自我提问,以加深理解和吸收知识。阅读结束后,反思和总结所学内容,并尝试应用到现实中,有助于深化理解和应用知识。与朋友或同事分享所读内容,讨论细节并获得反馈,也有助于加深对知识的理解和吸收。💡在这个美好的时刻,笔者不再啰嗦废话,现在毫不拖延地进入文章所要讨论的主题。接下来,我将为大家呈现正文内容。
一、核心数据结构
Redis,作为一款高性能的键值存储系统,其核心数据结构设计是其高效性能的关键。以下是Redis中几个特殊结构的详细解析:
1. 特殊结构
(1)HyperLogLog(基数统计)
HyperLogLog是一种概率数据结构,用于估算一个集合中元素的大致基数(即不同元素的数量)。其核心思想是通过多个独立的计数器来近似地估算集合的大小。每个计数器对应一个基数,通过这些计数器的并集来估计整个集合的基数。HyperLogLog的优势在于其空间效率非常高,即使是非常大的基数也能在极小的空间内进行估算。
(2)Bitmap(位图操作)
Bitmap是一种只使用一个位来表示一个元素是否存在的数据结构。在Redis中,位图可以用于高效地处理大量元素的集合操作,如集合的交、并、差等。例如,在用户活跃度统计中,可以使用位图来表示用户在一定时间内的活跃状态,从而快速统计活跃用户数量。
(3)GEO(地理空间索引)
GEO是Redis提供的一种地理空间索引功能,可以存储地理位置信息,支持查询距离指定位置在一定范围内的元素。它利用了Redis的有序集合(Sorted Set)数据结构,通过存储经纬度坐标和对应的值,实现了地理空间数据的存储和查询。
2. 底层实现
(1)跳跃表(Sorted Set实现)
跳跃表是一种数据结构,它通过在多个有序链表上建立索引来提高查找效率。在Redis中,跳跃表用于实现Sorted Set数据结构,提供高效的有序集合操作。跳跃表通过增加多级索引,使得查找、插入和删除操作的时间复杂度接近O(logN)。
(2)压缩列表(List/Hash优化存储)
压缩列表是一种优化内存使用的底层实现,它将多个小对象合并成一个连续的大对象,减少内存碎片。压缩列表内部使用一个元数据和多个元素值的数组来存储对象,通过减少内存碎片来提高内存使用效率。
(3)快速列表(QuickList)
快速列表是Redis 2.6版本引入的一种数据结构,它结合了链表和数组的优点。快速列表内部由多个快速链表和数组合并而成,当快速链表中的元素数量超过一定阈值时,将其转换为数组,从而保证了快速的随机访问,同时保持了内存的高效使用。
二、持久化机制
1. RDB
RDB是一种基于文件系统的持久化机制,它通过定时触发快照,将数据库状态保存到磁盘中。RDB的优点是恢复速度快,但缺点是数据一致性较差。
(1)快照触发条件
RDB的快照触发条件包括手动触发和自动触发。手动触发可以通过执行SAVE或BGSAVE命令实现;自动触发可以通过配置文件设置save参数。例如,可以设置当内存使用达到一定比例时自动触发快照。
(2)COW(写时复制)机制
RDB在写入数据时,会创建一个数据副本,从而保证数据的一致性。这种机制类似于Java中的写时复制(Copy-On-Write),可以减少数据复制操作的消耗。
2. AOF
AOF是一种基于文件系统的日志持久化机制,它将所有写操作记录到日志文件中。AOF的优点是数据一致性较好,但缺点是恢复速度较慢。
(1)重写压缩流程
AOF的重写压缩流程包括:触发重写、读取旧文件、重写新文件、替换旧文件。在重写过程中,Redis会创建一个新文件,将旧的写操作进行压缩,从而减少文件大小。
(2)fsync策略
fsync策略包括always、everysec和no三种,分别代表每次写操作都同步、每秒同步和不同步。不同的fsync策略会影响性能和数据安全性。例如,always策略保证了数据安全性,但会影响性能;而no策略可以提高性能,但可能会丢失数据。
三、高可用方案
1. 哨兵模式
哨兵模式是一种基于主从复制的Redis高可用方案。它通过监控多个节点,实现故障转移和数据一致性。
(1)主观/客观下线判定
哨兵通过主观下线和客观下线两种方式判定节点是否下线。主观下线是指单个哨兵认为节点下线;客观下线是指多个哨兵认为节点下线。
(2)领导者选举流程
当哨兵发现主节点下线时,会进行领导者选举,选举出新的主节点。选举过程中,哨兵节点会根据节点运行状态、权重等因素进行投票。
(3)故障转移时序控制
故障转移时序控制包括:检测主节点下线、选举新主节点、通知从节点切换主节点等。故障转移过程中,哨兵节点会确保数据一致性,并尽可能减少服务中断时间。
2. 集群模式
集群模式是一种基于多节点的Redis高可用方案。它通过哈希槽分配算法、ASK/MOVED重定向和Gossip协议通信,实现数据分片和故障转移。
(1)哈希槽分配算法
Redis集群使用哈希槽分配算法,将数据均匀分配到多个节点。每个键都会被映射到一个哈希槽,从而确定其存储节点。
(2)ASK/MOVED重定向
ASK/MOVED重定向是一种在故障转移过程中,通知客户端重定向请求的机制。当客户端请求的数据不在当前节点时,节点会返回ASK重定向,客户端需要连接到新的节点;当节点正在复制数据时,节点会返回MOVED重定向,客户端需要连接到目标节点。
(3)Gossip协议通信
Gossip协议是一种用于节点之间通信的协议,它可以帮助节点快速了解集群状态。节点通过定期发送Gossip消息,更新其他节点的状态信息。
四、高级特性
1. 内存管理
(1)LRU/LFU淘汰策略
Redis使用LRU(最近最少使用)和LFU(最不经常使用)两种淘汰策略,在内存不足时,自动淘汰不需要的数据。LRU淘汰最近最少使用的对象,而LFU淘汰最不经常使用的对象。
(2)内存碎片整理
Redis通过内存碎片整理,优化内存使用。内存碎片整理是指将内存中的碎片合并成连续的大块,从而提高内存使用效率。
(3)惰性删除机制
Redis采用惰性删除机制,在删除数据时,不立即释放内存,而是等待下次内存淘汰时释放。这样可以减少内存释放操作的消耗,提高Redis的性能。
2. 事务控制
(1)WATCH/MULTI/EXEC
WATCH/MULTI/EXEC是一种事务控制机制,它可以在执行事务前监控数据变化,保证数据一致性。WATCH命令用于监控键值对的变化,MULTI命令开始事务,EXEC命令执行事务。
(2)悲观锁实现
Redis通过SETNX命令实现悲观锁,确保在事务执行期间,数据不会被其他事务修改。SETNX命令用于设置键值对,如果键值对不存在,则设置成功,否则失败。
(3)Lua脚本原子性
Lua脚本在Redis中执行时,具有原子性,保证在执行过程中,不会被其他命令中断。这意味着Lua脚本在执行期间,其他命令无法更改其数据。
五、扩展组件
1. Redis模块
Redis模块是一种扩展Redis功能的方式,它可以添加新的数据类型、命令和持久化机制。
(1)RediSearch(全文检索)
RediSearch是一种基于Redis的全文检索模块,它可以提供高效的全文检索功能。RediSearch使用倒排索引来存储文本数据,从而实现快速检索。
(2)RedisGraph(图数据库)
RedisGraph是一种基于Redis的图数据库模块,它可以存储和查询图数据。RedisGraph使用邻接表来存储图数据,从而实现高效的图查询。
(3)RedisTimeSeries(时序数据)
RedisTimeSeries是一种基于Redis的时序数据模块,它可以存储和查询时序数据。RedisTimeSeries使用跳跃表来存储时序数据,从而实现高效的时序数据查询。
2. 生态工具
(1)RedisInsight(可视化监控)
RedisInsight是一种Redis可视化监控工具,它可以实时监控Redis性能和状态。RedisInsight可以展示Redis的内存使用情况、键值对数量、慢查询日志等信息。
(2)RedisBloom(布隆过滤器)
RedisBloom是一种基于Redis的布隆过滤器模块,它可以用于快速判断元素是否存在于集合中。RedisBloom使用多个布隆过滤器来提高准确率和性能。
(3)twemproxy(分片代理)
twemproxy是一种Redis分片代理,它可以实现Redis集群的负载均衡和故障转移。twemproxy可以将客户端请求分发到不同的Redis节点,从而提高性能和可用性。
六、性能优化
1. 客户端
(1)Pipeline批处理
Pipeline批处理可以将多个命令打包成一个请求,减少网络延迟。通过Pipeline批处理,可以减少客户端与Redis服务器之间的通信次数,从而提高性能。
(2)连接池配置
合理配置连接池,可以提高客户端与Redis服务器的连接效率。连接池可以减少连接创建和销毁的开销,提高性能。
(3)读写分离策略
读写分离策略可以将读操作和写操作分配到不同的节点,提高性能。读操作可以分配到从节点,写操作分配到主节点,从而提高读写分离的效率。
2. 服务端
(1)多IO线程
多IO线程可以提高Redis的并发处理能力。通过多IO线程,可以同时处理多个客户端请求,从而提高性能。
(2)后台线程优化
后台线程优化可以提高Redis的内存使用效率。Redis的后台线程包括复制线程、AOF重写线程等,优化这些线程可以减少内存消耗,提高性能。
(3)大key拆分方案
大key拆分方案可以将大key拆分成多个小key,提高Redis的读写性能。通过拆分大key,可以减少内存占用,提高Redis的读写效率。
📥博主的人生感悟和目标
- 💂 博客主页: Java程序员廖志伟希望各位读者大大多多支持用心写文章的博主,现在时代变了,信息爆炸,酒香也怕巷子深,博主真的需要大家的帮助才能在这片海洋中继续发光发热,所以,赶紧动动你的小手,点波关注❤️,点波赞👍,点波收藏⭐,甚至点波评论✍️,都是对博主最好的支持和鼓励!
- 👉 开源项目: Java程序员廖志伟
- 🌥 哔哩哔哩: Java程序员廖志伟
- 🎏 个人社区: Java程序员廖志伟
- 🔖 个人微信号:
SeniorRD
📙经过多年在优快云创作上千篇文章的经验积累,我已经拥有了不错的写作技巧。同时,我还与清华大学出版社签下了四本书籍的合约,并将陆续出版。这些书籍包括了基础篇、进阶篇、架构篇的📌《Java项目实战—深入理解大型互联网企业通用技术》📌,以及📚《解密程序员的思维密码--沟通、演讲、思考的实践》📚。具体出版计划会根据实际情况进行调整,希望各位读者朋友能够多多支持!
🔔如果您需要转载或者搬运这篇文章的话,非常欢迎您私信我哦~
2692

被折叠的 条评论
为什么被折叠?



