介绍:Redis(REmote DIctionary Server)远程字段服务, 是一个开源的使用 ANSI C 语言编写、遵守 BSD 协议、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API的非关系型数据库。
传统数据库遵循 ACID 规则。而 Nosql(Not Only SQL 的缩写,是对不同于传统的关系型数据库的数据库管理系统的统称) 一般为分布式而分布式一般遵循 CAP 定理。
Github 源码:https://github.com/antirez/redis
Redis 官网:https://redis.io/
Redis和Memcached区别:Redis是单线程模型,memcached支持多线程,但性能不是Redis瓶颈。Redis3.0推出后包含所有memcached的功能
Redis支持的数据类型?
String字符串:
格式: set key value
string类型是二进制安全的。意思是redis的string可以包含任何数据。比如jpg图片或者序列化的对象 。
string类型是Redis最基本的数据类型,一个键最大能存储512MB。
Hash(哈希、散列类型)
格式: hmset name key1 value1 key2 value2
Redis hash 是一个键值(key=>value)对集合。
Redis hash是一个string类型的field和value的映射表,hash特别适合用于存储对象。
散列类型的键值也是字典结构,且字段值只支持字符串。,一个键至多包含2的32次方减一个字段
List(列表)
Redis 列表是简单的字符串列表(双向链表),按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边)适用场景:新鲜事,因为不易修改,访问中间性能差
格式: lpush name value
在 key 对应 list 的头部添加字符串元素
格式: rpush name value
在 key 对应 list 的尾部添加字符串元素
格式: lrem name index
key 对应 list 中删除 count 个和 value 相同的元素
格式: llen name
返回 key 对应 list 的长度
索引从0开始
Set(集合)
格式: sadd name value
Redis的Set是string类型的无序集合。
集合是通过哈希表(hash table)实现的,所以添加,删除,查找的复杂度都是O(1)。
集合运算:差SDIFF 、交SINTER 、并SUNION
zset(sorted set:有序集合)
格式: zadd name score value
Redis zset 和 set 一样也是string类型元素的集合,且不允许重复的成员。
不同的是每个元素都会关联一个double类型的分数。redis正是通过分数来为集合中的成员进行从小到大的排序。
zset的成员是唯一的,但分数(score)却可以重复。
使用散列表和跳跃列表来存储,散列表存元素值和到分数的映射,跳跃列表存分数和到元素值的映射以实现排序功能
什么是Redis持久化?Redis有哪几种持久化方式?优缺点是什么?
持久化就是把内存的数据写到磁盘中去,防止服务宕机了内存数据丢失。
Redis 提供了两种持久化方式:RDB(默认) 和AOF
RDB:(快照模式)
rdb是Redis DataBase缩写,存储的默认文件:dump.rdb
功能核心函数rdbSave(生成RDB文件)和rdbLoad(从文件加载内存)两个函数
快照原理:1)Redis使用fork函数复制一份父进程的副本
2)父进程继续接受并处理客户端命令,子进程开始将内存中的数据写入硬盘中的临时文件;
3)子进程复制完所有数据后替换旧的RDB文件,一次快照完成。
缺点:Redis异常退出,最后一次快照之后的数据会丢失,数据重要要使用AOF
AOF:(记录每一条命令模式)
Aof是Append-only file缩写,
每当执行服务器(定时)任务或者函数时flushAppendOnlyFile 函数都会被调用(也就是Redis执行的每条记录都会被追加到硬盘文件), 这个函数执行以下两个工作
aof写入保存:
WRITE:根据条件,将 aof_buf 中的缓存写入到 AOF 文件
SAVE:根据条件,调用 fsync 或 fdatasync 函数,将 AOF 文件保存到磁盘中。
在磁盘中生成的默认文件:appendonly.aof
缺点:由于操作系统的缓存机制,数据并没有真正的写入硬盘,而是进入了系统的硬盘缓存,默认系统会30s执行一次同步,Redis可以使用everysec会泽配置成一秒同步一次
存储结构:
内容是redis通讯协议(RESP )格式的命令文本存储。
比较:
1、aof文件比rdb更新频率高,优先使用aof还原数据。
2、aof比rdb更安全也更大
3、rdb性能比aof好
4、如果两个都配了优先加载AOF,重启时用aof文件恢复,因为aof丢失的少。
刚刚上面你有提到redis通讯协议(RESP ),能解释下什么是RESP?有什么特点?(可以看到很多面试其实都是连环炮,面试官其实在等着你回答到这个点,如果你答上了对你的评价就又加了一分)
Redis支持两种通信协议:1)二进制安全统一请求协议 2)适于telnet程序的简单协议:RESP 是redis客户端和服务端之前使用的一种通讯协议;
错误恢复以-开头;状态回复以+开头;整数回复以:开头;字符串回复以$开头;多行字符串回复以*开头;以空格分割参数
Redis 有哪些架构模式?讲讲各自的特点
单机版
特点:简单
问题:
1、内存容量有限 2、处理能力有限 3、无法高可用。
主从复制(复制模式:Redis是乐观复制,容忍主从数据库一定时间内不同步,数据复制过程异步:主库执行结果返回给客户端的同时,异步将命令同步给从库)适合读多写少的场景
Redis 的复制(replication)功能允许用户根据一个 Redis 服务器来创建任意多个该服务器的复制品,其中被复制的服务器为主服务器(master),而通过复制创建出来的服务器复制品则为从服务器(slave)。 只要主从服务器之间的网络连接正常,主从服务器两者会具有相同的数据,主服务器就会一直将发生在自己身上的数据更新同步 给从服务器,从而一直保证主从服务器的数据相同。配置方法:在从数据库的配置文件加上:slaveof 主数据库地址 主数据库端口;主数据库无需进行配置。从数据库任何改动都不会同步给其他库,也会被主库的修改覆盖掉。
原理:1)复制初始化:从数据库启动向主数据库发送SYNC命令,主数据库收到命令进行快照并缓存命令,将其都交给从库,从数据库执行。(2.8版本之后增量复制,复制初始化是不使用快照了,直接网络发送给从库)
2)断线重连支持有条件的增量数据传输。
特点:
1、master/slave 角色
2、master/slave 数据相同
3、降低 master 读压力在转交从库
问题:
无法保证高可用
没有解决 master 写的压力
手动恢复过程:1)从数据库升级为主数据SLAVEOF NO ONE ;2)启动原先的主库设置为从库。一定不要在主数据库崩溃后自动重启,否则从库会被主库清空
哨兵(上边的主从复制管理麻烦,引入哨兵自动管理,其实还是主从复制)
Redis sentinel 是一个分布式系统中监控 redis 主从服务器,并在主服务器下线时自动进行故障转移。配置:sentinel.conf配置文件中配置主库信息,从库会自动寻找到,不必配置从库。最后一个数表示选举时最低通过票数
原理:哨兵启动后会建立两个链接,一个链接订阅主库频道,以获得其他哨兵信息,另一条链接发送命令:每十秒向主从库发送info命令、每两秒向主数据库发送自己这个哨兵的信息、每一秒PING主从库和其他哨兵;指定时间PING不通表示“主观下线”,询问其他哨兵,指定数量的哨兵都认为下线则表示:“客观下线”;Raft算法选举哨兵头(发现主观下线的哨兵向每个哨兵发送要求自己成为零头,其他哨兵没有选择其他哨兵,且数量超过配置的限制则成为哨兵头,主导服务恢复,如果其他哨兵选举了其他人则等待随机的时间重新发起选举,直到成功)。哨兵头选从库恢复的机制:优先级最大的从库>命令偏移量最大>运行id最小的从库。
哨兵较少不行,哨兵本身可能故障,也不利于哨兵选举;每个节点部署一个哨兵
其中三个特性:
监控(Monitoring): Sentinel 会不断地检查你的主服务器和从服务器是否运作正常。
提醒(Notification): 当被监控的某个 Redis 服务器出现问题时, Sentinel 可以通过 API 向管理员或者其他应用程序发送通知。
自动故障迁移(Automatic failover): 当一个主服务器不能正常工作时, Sentinel 会开始一次自动故障迁移操作。
特点:
1、保证高可用
2、监控各个节点
3、自动故障迁移
缺点:主从模式,切换需要时间丢数据
没有解决 master 写的压力
为什么用集群(每个数据库依然保存所有的数据,受限于单个节点的内存,形成木桶效应)
集群(proxy 型):
Twemproxy 是一个 Twitter 开源的一个 redis 和 memcache 快速/轻量级代理服务器; Twemproxy 是一个快速的单线程代理程序,支持 Memcached ASCII 协议和 redis 协议。
特点:1、多种 hash 算法:MD5、CRC16、CRC32、CRC32a、hsieh、murmur、Jenkins
2、支持失败节点自动删除
3、后端 Sharding 分片逻辑对业务透明,业务方的读写方式和操作单个 Redis 一致
缺点:增加了新的 proxy,需要维护其高可用。
failover 逻辑需要自己实现,其本身不能支持故障的自动转移可扩展性差,进行扩缩容都需要手动干预
集群(直连型):
从redis 3.0之后版本支持redis-cluster集群,Redis-Cluster采用无中心结构,每个节点保存数据和整个集群状态,每个节点都和其他所有节点连接。配置:每个数据库节点代开cluster-enabled配置项打开,且最少有三个库,用redis-trib.rb文件来配置。集群启动后向每个节点发送CLUSTER MEET ip port 告诉其他节点。新加入一个节点也是通过CLUSTER MEET通知另一个节点,另一个节点握手成功后用Gossip命令通知其他节点。新加入的节点要么作为从数据库,要么向集群申请分配插槽作为主数据库。一个集群所有键分配给16384个插槽,每个主数据库负责其中一部分:键名使用CRC16算法计算散列值然后对16384取余数得到分配的插槽,在分配到指定的节点。加入新节点插槽迁移,会造成键的临时丢失,客户端需要相应ASK跳转来避免丢失。客户端请求集群某一个节点,如果键在该节点则直接操作,不在该节点则move重定向,告诉哪个节点管,然后客户端重新发一次请求到目标节点(客户端重定向时会缓存插槽由哪个节点负责的路由信息)故障恢复:同哨兵
特点:
1、无中心架构(不存在哪个节点影响性能瓶颈),少了 proxy 层。
2、数据按照 slot 存储分布在多个节点,节点间数据共享,可动态调整数据分布。
3、可扩展性,可线性扩展到 1000 个节点,节点可动态添加或删除。
4、高可用性,部分节点不可用时,集群仍可用。通过增加 Slave 做备份数据副本
5、实现故障自动 failover,节点之间通过 gossip 协议交换状态信息,用投票机制完成 Slave到 Master 的角色提升。
缺点:
1、资源隔离性较差,容易出现相互影响的情况。
2、数据通过异步复制,不保证数据的强一致性
什么是一致性哈希算法?什么是哈希槽?
这两个问题篇幅过长 网上找了两个解锁的不错的文章
https://www.cnblogs.com/lpfuture/p/5796398.html
http://www.jasontec.cn/articles/2020/04/11/1586586130767.html
Redis常用命令?
Keys pattern
*表示区配所有
以bit开头的
查看Exists key是否存在
Set
设置 key 对应的值为 string 类型的 value。
setnx
设置 key 对应的值为 string 类型的 value。如果 key 已经存在,返回 0,nx 是 not exist 的意思。
删除某个key
第一次返回1 删除了 第二次返回0
Expire 设置过期时间(单位秒)
TTL查看剩下多少时间
返回负数则key失效,key不存在了
Setex
设置 key 对应的值为 string 类型的 value,并指定此键值对应的有效期。
Mset
一次设置多个 key 的值,成功返回 ok 表示所有的值都设置了,失败返回 0 表示没有任何值被设置。
Getset
设置 key 的值,并返回 key 的旧值。
Mget
一次获取多个 key 的值,如果对应 key 不存在,则对应返回 nil。
Incr
对 key 的值做加加操作,并返回新的值。注意 incr 一个不是 int 的 value 会返回错误,incr 一个不存在的 key,则设置 key 为 1
incrby
同 incr 类似,加指定值 ,key 不存在时候会设置 key,并认为原来的 value 是 0
Decr
对 key 的值做的是减减操作,decr 一个不存在 key,则设置 key 为-1
Decrby
同 decr,减指定值。
Append
给指定 key 的字符串值追加 value,返回新字符串值的长度。
Strlen
取指定 key 的 value 值的长度。
persist xxx(取消过期时间)
选择数据库(0-15库)
Select 0 //选择数据库
move age 1//把age 移动到1库
Randomkey随机返回一个key
Rename重命名
Type 返回数据类型
08
使用过Redis分布式锁么,它是怎么实现的?
先拿setnx来争抢锁,抢到之后,再用expire给锁加一个过期时间防止锁忘记了释放。
如果在setnx之后执行expire之前进程意外crash或者要重启维护了,那会怎么样?
set指令有非常复杂的参数,这个应该是可以同时把setnx和expire合成一条指令来用的!
09
使用过Redis做异步队列么,你是怎么用的?有什么缺点?
1、一般使用list结构作为队列,rpush生产消息,lpop消费消息。当lpop没有消息的时候,要适当sleep一会再重试。
2、BRPOP和RPOP类似,区别是当队列为空时BRPOP命令会阻塞链接,直到有新元素加入。如果BRPOP同时接受多个建可以实现优先级队列,如果所有键都没有则阻塞,如果其中一个键有元素则从该键中弹出元素,多个键有元素则从左到右。
缺点:
在消费者下线的情况下,生产的消息会丢失,得使用专业的消息队列如rabbitmq等。
能不能生产一次消费多次呢?
使用pub/sub主题订阅者模式,可以实现1:N的消息队列。
发布者:PUBLISH channel message 订阅者:SUBSCRIBE channel [channel ...],订阅状态下的客户端不能执行除了发布订阅模式命令之外的命令。可用PSHBSCRIBE名利配置订阅规则,支持glob风格,可重复订阅。
管道的作用:Redis和客户端使用TCP连接,对管道(pipelining)提供了支持,通过管道可以一次性发送多条命令,并在执行完后一次性返回结果,作用减少通信次数,降低返回延迟。
Redis如何节省空间:1、精简键名和键值 2、内部编码优化:Redis为每种数据类型提供了两种内部编码方式,列表为例,Redis当键中元素很少时会采用建凑型但性能较差的编码方式。3、一个键值可以被多个键引用
Redis支持多数据库
10
什么是缓存穿透?如何避免?什么是缓存雪崩?何如避免?
缓存穿透
一般的缓存系统,都是按照key去缓存查询,如果不存在对应的value,就应该去后端系统查找(比如DB)。一些恶意的请求会故意查询不存在的key,请求量很大,就会对后端系统造成很大的压力。这就叫做缓存穿透。
如何避免?
1:对查询结果为空的情况也进行缓存,缓存时间设置短一点,或者该key对应的数据insert了之后清理缓存。
2:对一定不存在的key进行过滤。可以把所有的可能存在的key放到一个大的Bitmap中,查询时通过该bitmap过滤。
缓存雪崩
当缓存服务器重启或者大量缓存集中在某一个时间段失效,这样在失效的时候,会给后端系统带来很大压力。导致系统崩溃。
如何避免?
1:在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。
2:做二级缓存,A1为原始缓存,A2为拷贝缓存,A1失效时,可以访问A2,A1缓存失效时间设置为短期,A2设置为长期
3:不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。
11、lua脚本
好处:减少网络开销、原子操作、复用。 用法:eval 脚本文件地址 要操作的键 , 参数 脚本中使用KEYS[1]和ARGV[1]获取命令中传的键和参数
数据类型:空(nil)、布尔(boolean) 、数字(number)、字符串(string)、表(table)、函数(function)。脚本中不能使用全局变量。声明变量前边加local,支持多重赋值。操作符:不等于是~=,逻辑运算符:not、and、or,只要操作数不是nil或false就是真,0或者空也是真,and中a and b 如果a是真则返回b,#获取字符串或表长度。
表是lua唯一数据结构,索引从1开始,可以理解为关联数组,空类型不能作为索引,迭代器:ipairs。return和break必须在end、else或until之前是其前的最后一句。提供cjson对json进行支持
脚本调用Redis命令:redis.call()返回Redis的执行结果;脚本内容通过return返回给Redis。安全:禁用脚本全局变量、保障隔离、禁止使用lua标准库中与系统调用有关的函数、替换了随机数函数,每次返回结果都一样,需要随机数种子。
原子性:Redis执行脚本则不会执行其他命令,所以可以设置脚本最长执行时间,超时接受其他命令时返回busy。