redis

最新推荐文章于 2024-09-02 22:46:05 发布

原创最新推荐文章于 2024-09-02 22:46:05 发布 · 392 阅读

1 ·

CC 4.0 BY-SA版权

hadoop 专栏收录该内容

25 篇文章

订阅专栏

本文探讨Redis作为非关系型数据库在互联网架构中扮演的缓存角色，减轻数据库压力，尤其适用于频繁变动的key-value数据。深入分析Redis集群方案，包括Twitter的Twemproxy、豌豆荚的Codis及官方的Redis-Cluster，对比其优劣。同时，介绍了Redis的数据持久化机制AOF与RDB，以及4.0版本中AOF-RDB混合方案。

1.为什么使用redis？

redis是一种典型的no-sql 即非关系数据库像python的字典一样存储key-value键值对工作在memory中

所以很适合用来充当整个互联网架构中各级之间的cache 比如lvs的4层转发层 nginx的7层代理层

尤其是lnmp架构应用层如php-fpm或者是Tomcat到mysql之间做一个cache 以减轻db的压力

因为有相当一部分的数据只是简单的key-value对应关系，而且在实际的业务中常常在短时间内迅速变动

如果用关系数据库mysql之类存储会大大增加对db的访问导致db的负担很重因为所有的require中的大部分最后都要汇聚到db

所以如果想要业务稳定那么解决db的压力就是关键所以现在大部分的解决方案就是在db层之上的各级使用多级的no-sql

像memcache redis 等来为db提供缓冲

2.为什么使用redis-cluster？

为了在大流量访问下提供稳定的业务，集群化是存储的必然形态

未来的发展趋势肯定是云计算和大数据的紧密结合只有分布式架构能满足要求

如果没有集群化何来的分布式？

3.顺带一提总结一波今天的redis原理之数据持久化

虽然redis这种no-sql一般都是作为cache来服务但是如果完全没有数据可持久化的方法那么显得有些单薄

就像memcache 由于这种no-sql是工作在memory的那么由于memory的实体是ram

所以如果重启或者宕机 memory中的数据就全没了数据的一致性的不到保障

但是 redis不同 redis有相对的数据持久化的方案由两种方式构成 aof & rdb

aof就像关系数据库中的binlog一样把每一次写操作以追加的形式记录在其中以文件的形式刷到磁盘里

并且可以使用不同的fsync策略无fsync,每秒fsync,每次写的时候fsync.

使用默认的每秒fsync策略,Redis的性能依然很好(fsync是由后台线程进行处理的,主线程会尽力处理客户端请求)

一旦出现故障，最多丢失1秒的数据.

但是缺点也随之而来那就是aof文件的大小会随着时间线性增长一段时间之后就会变得很大

如果要在一端以AOF的形式来恢复数据那么由于AOF文件的巨大体积可能会让进程如同假死一样十分的慢

rdb则是一种快照机制

redis工作在内存中 rdb就是每隔一段时间对内存中的数据做一次快照保存在rdb文件中

而且redis的主从同步可以实现异步也是由于rdb的机制他在做快照时会fork出一个子进程由子进程来做快照

父进程完全处理请求毫不影响很适合数据的备份

但是问题是如果数据量很大的话 rdb它要保存一个完整的数据集是一个大的工作如果时间间隔设置的太短

那么严重影响redis的性能但是按照常规设置的话如5分钟一次那么如果宕机或者重启就会基于上次做rdb的时间

从而丢失分钟级的数据

point：在redis4.0的新特性中采用了aof-rdb的混合方案来保障数据的持久性但是官方的说法是还不成熟

是一个长期的工作所以有待观察吧

4.redis集群实现方案：

关于redis的集群化方案目前有三种

（1）Twitter开发的twemproxy

（2）豌豆荚开发的codis

（3）redis官方的redis-cluster

简介：twemproxy架构简单就是用proxy对后端redis server进行代理但是由于代理层的消耗性能很低而且通常涉及多个key的操作都是不支持的而且本身不支持动态扩容和透明的数据迁移而且也失去维护 Twitter内部已经不使用了

redis-cluster是三个里性能最强大的因为他使用去中心化的思想使用hash slot方式将16348个hash slot 覆盖到所有节点上对于存储的每个key值使用CRC16(KEY)&16348=slot 得到他对应的hash slot 并在访问key时就去找他的hash slot在哪一个节点上然后由当前访问节点从实际被分配了这个hash slot的节点去取数据节点之间使用轻量协议通信减少带宽占用性能很高自动实现负载均衡与高可用自动实现failover 并且支持动态扩展官方已经玩到可以1000个节点实现的复杂度低总之个人比较喜欢这个架构因为他的去中心化思想免去了proxy的消耗是全新的思路

但是它也有一些不足例如官方没有提供图形化管理工具运维体验差全手工数据迁移并且自己对自己本身的redis命令支持也不完全等但是这些问题我觉得不能掩盖他关键的新思想所带来的的优势随着官方的推进这些问题应该都能在一定时间内得到解决那么这时候去中心化思想带来的高性能就会表现出他巨大的优势

codis使用的也是proxy思路但是做的比较好是这两种之间的一个中间级而且支持redis命令是最多的有图形化GUI管理和监控工具运维友好这个过段时间会详细另外写出来原理工作机制和搭建实现

1、redis单机安装配置

1.上传到linux

2、解压tar -zxvf ....

3、cd 解压好的目录 apps/redis....

make && make install

或者

make

make install

配置文件：

redis.conf

daemonize no
pidfile /var/run/redis.pid
port 6379
requirepass lucas
protected-mode no

启动redis：src目录下 ./redis-server ../redis.conf

在idea中连接redis

1.依赖

        <dependency>
            <groupId>redis.clients</groupId>
            <artifactId>jedis</artifactId>
            <version>2.9.0</version>
        </dependency>

2.代码：

public static void main(String[] args) {
        Jedis jedis = new Jedis("hdp-1");
        jedis.auth("lucas");
//        jedis.set("title","helloworld");
        System.out.println(jedis.get("age"));
    }

3.从kafka的consumer中消费出数据保存到redis中

1、ELT

Nigix、Kafka、Flume、Storm

产生的日志不是滚动日志