Redis核心技术与应用-优快云博客

本文链接：https://blog.youkuaiyun.com/qililong88/article/details/105646685

介绍：Redis（REmote DIctionary Server）远程字段服务，是一个开源的使用 ANSI C 语言编写、遵守 BSD 协议、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库，并提供多种语言的 API的非关系型数据库。

传统数据库遵循 ACID 规则。而 Nosql（Not Only SQL 的缩写，是对不同于传统的关系型数据库的数据库管理系统的统称）一般为分布式而分布式一般遵循 CAP 定理。

Github 源码：https://github.com/antirez/redis

Redis 官网：https://redis.io/

Redis和Memcached区别：Redis是单线程模型，memcached支持多线程，但性能不是Redis瓶颈。Redis3.0推出后包含所有memcached的功能

Redis支持的数据类型？

String字符串：

格式: set key value

string类型是二进制安全的。意思是redis的string可以包含任何数据。比如jpg图片或者序列化的对象。

string类型是Redis最基本的数据类型，一个键最大能存储512MB。

Hash（哈希、散列类型）

格式: hmset name key1 value1 key2 value2

Redis hash 是一个键值(key=>value)对集合。

Redis hash是一个string类型的field和value的映射表，hash特别适合用于存储对象。

散列类型的键值也是字典结构，且字段值只支持字符串。，一个键至多包含2的32次方减一个字段

List（列表）

Redis 列表是简单的字符串列表（双向链表），按照插入顺序排序。你可以添加一个元素到列表的头部（左边）或者尾部（右边）适用场景：新鲜事，因为不易修改，访问中间性能差

格式: lpush name value

在 key 对应 list 的头部添加字符串元素

格式: rpush name value

在 key 对应 list 的尾部添加字符串元素

格式: lrem name index

key 对应 list 中删除 count 个和 value 相同的元素

格式: llen name

返回 key 对应 list 的长度

索引从0开始

Set（集合）

格式: sadd name value

Redis的Set是string类型的无序集合。

集合是通过哈希表（hash table）实现的，所以添加，删除，查找的复杂度都是O(1)。

集合运算：差SDIFF 、交SINTER 、并SUNION

zset(sorted set：有序集合)

格式: zadd name score value

Redis zset 和 set 一样也是string类型元素的集合,且不允许重复的成员。

不同的是每个元素都会关联一个double类型的分数。redis正是通过分数来为集合中的成员进行从小到大的排序。

zset的成员是唯一的,但分数(score)却可以重复。

使用散列表和跳跃列表来存储，散列表存元素值和到分数的映射，跳跃列表存分数和到元素值的映射以实现排序功能

什么是Redis持久化？Redis有哪几种持久化方式？优缺点是什么？

持久化就是把内存的数据写到磁盘中去，防止服务宕机了内存数据丢失。

Redis 提供了两种持久化方式:RDB（默认）和AOF

RDB：（快照模式）

rdb是Redis DataBase缩写，存储的默认文件：dump.rdb

功能核心函数rdbSave(生成RDB文件)和rdbLoad（从文件加载内存）两个函数

快照原理：1)Redis使用fork函数复制一份父进程的副本

2）父进程继续接受并处理客户端命令，子进程开始将内存中的数据写入硬盘中的临时文件；

3）子进程复制完所有数据后替换旧的RDB文件，一次快照完成。

缺点：Redis异常退出，最后一次快照之后的数据会丢失，数据重要要使用AOF

AOF:（记录每一条命令模式）

Aof是Append-only file缩写，

每当执行服务器(定时)任务或者函数时flushAppendOnlyFile 函数都会被调用（也就是Redis执行的每条记录都会被追加到硬盘文件），这个函数执行以下两个工作

aof写入保存：

WRITE：根据条件，将 aof_buf 中的缓存写入到 AOF 文件

SAVE：根据条件，调用 fsync 或 fdatasync 函数，将 AOF 文件保存到磁盘中。

在磁盘中生成的默认文件：appendonly.aof

缺点：由于操作系统的缓存机制，数据并没有真正的写入硬盘，而是进入了系统的硬盘缓存，默认系统会30s执行一次同步，Redis可以使用everysec会泽配置成一秒同步一次

存储结构:

内容是redis通讯协议(RESP )格式的命令文本存储。

比较：

1、aof文件比rdb更新频率高，优先使用aof还原数据。

2、aof比rdb更安全也更大

3、rdb性能比aof好

4、如果两个都配了优先加载AOF，重启时用aof文件恢复，因为aof丢失的少。

刚刚上面你有提到redis通讯协议(RESP )，能解释下什么是RESP？有什么特点？（可以看到很多面试其实都是连环炮，面试官其实在等着你回答到这个点，如果你答上了对你的评价就又加了一分）

Redis支持两种通信协议：1）二进制安全统一请求协议 2）适于telnet程序的简单协议：RESP 是redis客户端和服务端之前使用的一种通讯协议；

错误恢复以-开头；状态回复以+开头；整数回复以：开头；字符串回复以$开头；多行字符串回复以*开头；以空格分割参数

Redis 有哪些架构模式？讲讲各自的特点

单机版

特点：简单

问题：

1、内存容量有限 2、处理能力有限 3、无法高可用。

主从复制（复制模式:Redis是乐观复制，容忍主从数据库一定时间内不同步，数据复制过程异步：主库执行结果返回给客户端的同时，异步将命令同步给从库）适合读多写少的场景

Redis 的复制（replication）功能允许用户根据一个 Redis 服务器来创建任意多个该服务器的复制品，其中被复制的服务器为主服务器（master），而通过复制创建出来的服务器复制品则为从服务器（slave）。只要主从服务器之间的网络连接正常，主从服务器两者会具有相同的数据，主服务器就会一直将发生在自己身上的数据更新同步给从服务器，从而一直保证主从服务器的数据相同。配置方法：在从数据库的配置文件加上：slaveof 主数据库地址主数据库端口；主数据库无需进行配置。从数据库任何改动都不会同步给其他库，也会被主库的修改覆盖掉。

原理：1）复制初始化：从数据库启动向主数据库发送SYNC命令，主数据库收到命令进行快照并缓存命令，将其都交给从库，从数据库执行。（2.8版本之后增量复制，复制初始化是不使用快照了，直接网络发送给从库）

2）断线重连支持有条件的增量数据传输。

特点：

1、master/slave 角色

2、master/slave 数据相同

3、降低 master 读压力在转交从库

问题：

无法保证高可用

没有解决 master 写的压力

手动恢复过程：1）从数据库升级为主数据SLAVEOF NO ONE ；2）启动原先的主库设置为从库。一定不要在主数据库崩溃后自动重启，否则从库会被主库清空

哨兵（上边的主从复制管理麻烦，引入哨兵自动管理，其实还是主从复制）

Redis sentinel 是一个分布式系统中监控 redis 主从服务器，并在主服务器下线时自动进行故障转移。配置：sentinel.conf配置文件中配置主库信息，从库会自动寻找到，不必配置从库。最后一个数表示选举时最低通过票数

原理：哨兵启动后会建立两个链接，一个链接订阅主库频道，以获得其他哨兵信息，另一条链接发送命令：每十秒向主从库发送info命令、每两秒向主数据库发送自己这个哨兵的信息、每一秒PING主从库和其他哨兵；指定时间PING不通表示“主观下线”，询问其他哨兵，指定数量的哨兵都认为下线则表示：“客观下线”；Raft算法选举哨兵头（发现主观下线的哨兵向每个哨兵发送要求自己成为零头，其他哨兵没有选择其他哨兵，且数量超过配置的限制则成为哨兵头，主导服务恢复，如果其他哨兵选举了其他人则等待随机的时间重新发起选举，直到成功）。哨兵头选从库恢复的机制：优先级最大的从库>命令偏移量最大>运行id最小的从库。

哨兵较少不行，哨兵本身可能故障，也不利于哨兵选举；每个节点部署一个哨兵

其中三个特性：

监控（Monitoring）： Sentinel 会不断地检查你的主服务器和从服务器是否运作正常。

提醒（Notification）：当被监控的某个 Redis 服务器出现问题时， Sentinel 可以通过 API 向管理员或者其他应用程序发送通知。

自动故障迁移（Automatic failover）：当一个主服务器不能正常工作时， Sentinel 会开始一次自动故障迁移操作。

特点：

1、保证高可用

2、监控各个节点

3、自动故障迁移

缺点：主从模式，切换需要时间丢数据

没有解决 master 写的压力

为什么用集群（每个数据库依然保存所有的数据，受限于单个节点的内存，形成木桶效应）

集群（proxy 型）：

Twemproxy 是一个 Twitter 开源的一个 redis 和 memcache 快速/轻量级代理服务器； Twemproxy 是一个快速的单线程代理程序，支持 Memcached ASCII 协议和 redis 协议。

特点：1、多种 hash 算法：MD5、CRC16、CRC32、CRC32a、hsieh、murmur、Jenkins

2、支持失败节点自动删除

3、后端 Sharding 分片逻辑对业务透明，业务方的读写方式和操作单个 Redis 一致

缺点：增加了新的 proxy，需要维护其高可用。

failover 逻辑需要自己实现，其本身不能支持故障的自动转移可扩展性差，进行扩缩容都需要手动干预

集群（直连型）：

从redis 3.0之后版本支持redis-cluster集群，Redis-Cluster采用无中心结构，每个节点保存数据和整个集群状态,每个节点都和其他所有节点连接。配置：每个数据库节点代开cluster-enabled配置项打开，且最少有三个库，用redis-trib.rb文件来配置。集群启动后向每个节点发送CLUSTER MEET ip port 告诉其他节点。新加入一个节点也是通过CLUSTER MEET通知另一个节点，另一个节点握手成功后用Gossip命令通知其他节点。新加入的节点要么作为从数据库，要么向集群申请分配插槽作为主数据库。一个集群所有键分配给16384个插槽，每个主数据库负责其中一部分：键名使用CRC16算法计算散列值然后对16384取余数得到分配的插槽，在分配到指定的节点。加入新节点插槽迁移，会造成键的临时丢失，客户端需要相应ASK跳转来避免丢失。客户端请求集群某一个节点，如果键在该节点则直接操作，不在该节点则move重定向，告诉哪个节点管，然后客户端重新发一次请求到目标节点（客户端重定向时会缓存插槽由哪个节点负责的路由信息）故障恢复：同哨兵

特点：

1、无中心架构（不存在哪个节点影响性能瓶颈），少了 proxy 层。

2、数据按照 slot 存储分布在多个节点，节点间数据共享，可动态调整数据分布。

3、可扩展性，可线性扩展到 1000 个节点，节点可动态添加或删除。

4、高可用性，部分节点不可用时，集群仍可用。通过增加 Slave 做备份数据副本

5、实现故障自动 failover，节点之间通过 gossip 协议交换状态信息，用投票机制完成 Slave到 Master 的角色提升。

缺点：

1、资源隔离性较差，容易出现相互影响的情况。

2、数据通过异步复制,不保证数据的强一致性

什么是一致性哈希算法？什么是哈希槽？

这两个问题篇幅过长网上找了两个解锁的不错的文章

https://www.cnblogs.com/lpfuture/p/5796398.html

http://www.jasontec.cn/articles/2020/04/11/1586586130767.html

Redis常用命令？

Keys pattern

*表示区配所有

以bit开头的

查看Exists key是否存在

Set

设置 key 对应的值为 string 类型的 value。

setnx

设置 key 对应的值为 string 类型的 value。如果 key 已经存在，返回 0，nx 是 not exist 的意思。

删除某个key

第一次返回1 删除了第二次返回0

Expire 设置过期时间（单位秒）

TTL查看剩下多少时间

返回负数则key失效，key不存在了

Setex

设置 key 对应的值为 string 类型的 value，并指定此键值对应的有效期。

Mset

一次设置多个 key 的值，成功返回 ok 表示所有的值都设置了，失败返回 0 表示没有任何值被设置。

Getset

设置 key 的值，并返回 key 的旧值。

Mget

一次获取多个 key 的值，如果对应 key 不存在，则对应返回 nil。

Incr

对 key 的值做加加操作,并返回新的值。注意 incr 一个不是 int 的 value 会返回错误，incr 一个不存在的 key，则设置 key 为 1

incrby

同 incr 类似，加指定值，key 不存在时候会设置 key，并认为原来的 value 是 0

Decr

对 key 的值做的是减减操作，decr 一个不存在 key，则设置 key 为-1

Decrby

同 decr，减指定值。

Append

给指定 key 的字符串值追加 value,返回新字符串值的长度。

Strlen

取指定 key 的 value 值的长度。

persist xxx(取消过期时间)

选择数据库（0-15库）

Select 0 //选择数据库

move age 1//把age 移动到1库

Randomkey随机返回一个key

Rename重命名

Type 返回数据类型

使用过Redis分布式锁么，它是怎么实现的？

先拿setnx来争抢锁，抢到之后，再用expire给锁加一个过期时间防止锁忘记了释放。

如果在setnx之后执行expire之前进程意外crash或者要重启维护了，那会怎么样？

set指令有非常复杂的参数，这个应该是可以同时把setnx和expire合成一条指令来用的！

使用过Redis做异步队列么，你是怎么用的？有什么缺点？

1、一般使用list结构作为队列，rpush生产消息，lpop消费消息。当lpop没有消息的时候，要适当sleep一会再重试。

2、BRPOP和RPOP类似，区别是当队列为空时BRPOP命令会阻塞链接，直到有新元素加入。如果BRPOP同时接受多个建可以实现优先级队列，如果所有键都没有则阻塞，如果其中一个键有元素则从该键中弹出元素，多个键有元素则从左到右。

缺点：

在消费者下线的情况下，生产的消息会丢失，得使用专业的消息队列如rabbitmq等。

能不能生产一次消费多次呢？

使用pub/sub主题订阅者模式，可以实现1:N的消息队列。

发布者：PUBLISH channel message 订阅者：SUBSCRIBE channel [channel ...]，订阅状态下的客户端不能执行除了发布订阅模式命令之外的命令。可用PSHBSCRIBE名利配置订阅规则，支持glob风格，可重复订阅。

管道的作用：Redis和客户端使用TCP连接，对管道（pipelining）提供了支持，通过管道可以一次性发送多条命令，并在执行完后一次性返回结果，作用减少通信次数，降低返回延迟。

Redis如何节省空间：1、精简键名和键值 2、内部编码优化：Redis为每种数据类型提供了两种内部编码方式，列表为例，Redis当键中元素很少时会采用建凑型但性能较差的编码方式。3、一个键值可以被多个键引用

Redis支持多数据库

什么是缓存穿透？如何避免？什么是缓存雪崩？何如避免？

缓存穿透

一般的缓存系统，都是按照key去缓存查询，如果不存在对应的value，就应该去后端系统查找（比如DB）。一些恶意的请求会故意查询不存在的key,请求量很大，就会对后端系统造成很大的压力。这就叫做缓存穿透。

如何避免？

1：对查询结果为空的情况也进行缓存，缓存时间设置短一点，或者该key对应的数据insert了之后清理缓存。

2：对一定不存在的key进行过滤。可以把所有的可能存在的key放到一个大的Bitmap中，查询时通过该bitmap过滤。

缓存雪崩

当缓存服务器重启或者大量缓存集中在某一个时间段失效，这样在失效的时候，会给后端系统带来很大压力。导致系统崩溃。

如何避免？

1：在缓存失效后，通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存，其他线程等待。

2：做二级缓存，A1为原始缓存，A2为拷贝缓存，A1失效时，可以访问A2，A1缓存失效时间设置为短期，A2设置为长期

3：不同的key，设置不同的过期时间，让缓存失效的时间点尽量均匀。

11、lua脚本

好处：减少网络开销、原子操作、复用。用法：eval 脚本文件地址要操作的键，参数脚本中使用KEYS[1]和ARGV[1]获取命令中传的键和参数

数据类型：空（nil）、布尔(boolean) 、数字（number）、字符串（string）、表（table）、函数（function）。脚本中不能使用全局变量。声明变量前边加local，支持多重赋值。操作符：不等于是~=，逻辑运算符：not、and、or，只要操作数不是nil或false就是真，0或者空也是真，and中a and b 如果a是真则返回b，#获取字符串或表长度。

表是lua唯一数据结构，索引从1开始，可以理解为关联数组，空类型不能作为索引，迭代器：ipairs。return和break必须在end、else或until之前是其前的最后一句。提供cjson对json进行支持

脚本调用Redis命令：redis.call()返回Redis的执行结果；脚本内容通过return返回给Redis。安全：禁用脚本全局变量、保障隔离、禁止使用lua标准库中与系统调用有关的函数、替换了随机数函数，每次返回结果都一样，需要随机数种子。

原子性：Redis执行脚本则不会执行其他命令，所以可以设置脚本最长执行时间，超时接受其他命令时返回busy。