浅析一致性哈希算法的原理及实现

最新推荐文章于 2024-09-09 23:52:55 发布

Thecoastlines

最新推荐文章于 2024-09-09 23:52:55 发布

阅读量879

点赞数

CC 4.0 BY-SA版权

分类专栏：数据结构和算法文章标签：哈希算法算法

本文链接：https://blog.youkuaiyun.com/kevinnsm/article/details/125813227

数据结构和算法专栏收录该内容

42 篇文章

订阅专栏

本文探讨了在流量增大时，分布式缓存从单节点到多节点的演进，指出简单哈希算法在节点增减时可能导致大量缓存不命中。为了解决这一问题，文章介绍了使用一致性哈希算法，它通过虚拟节点的引入，实现了更好的容错性和扩展性，减少了数据重定位。然而，一致性哈希也可能导致数据倾斜，为此提出了虚拟节点的概念来平衡负载。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.分布式缓存问题

在这里插入图片描述
以上是单节点环境下，但随着流量的增大，可能就演变为了如下情形：

❓这个负载均衡算法该如何设计最为合理呢？
首先能想到的最简单的方法可能就是随机或者轮询，这样会产生两个问题：一是数据冗余；二是数据可能已经被缓存，但请求却命中了不存在该数据的节点上。

如何解决这个问题？只需要保证相同的key被发送给相同节点上即可。再一想这不就是hash算法嘛【index = hash(key) % n】（n为节点的数量）

public class SimpleHash {

    public int loadBalance(String key) {
        return hash(key) % 3;
    }
    private int hash(String key) {
        int hash = Math.abs(key.hashCode());
        .....
        .....
        return hash;
    }
}

这种算法它的容错性和扩展性不是很好；一旦某个节点宕机或者加入新的节点时，导致n发生了变化，需要重新hash计算，这样可能导致大量缓存不命中，一瞬间给磁盘数据库造成了很大的压力。

容错性是指当某个节点宕机时，整个系统是否可以继续高效运行；扩展性是指加入新节点时，整个系统是否可以高效运行。

所以这种简单的哈希算法并不适用于实际场景，而本文所讲的一致性哈希算法解决了大量哈希重定位的问题。

2.一致性哈希算法

一致性哈希引入了一个虚拟的圆环，这个圆环有2^32个节点组成(0~ 2^32）；
在这里插入图片描述
📚它的原理如下：

(1)对每个缓存服务器的IP作为key进行哈希计算，得到的结果一定分布在环上。
(2)对每个数据作为key进行哈希计算，得到的结果也一定分布在环上
在这里插入图片描述
按照顺时针，第一台遇到的节点就是该数据定位到的服务器。

❓当节点宕机或者添加新的节点时，它会出现什么样的结果呢？
在这里插入图片描述

public class ConsistentHash {
    private static final String[] NODES = {"123.23.34.1", "123.52.2.1", "43.122.54.1"};
    //模拟环形哈希表
    private static final SortedMap<Integer, String> CIRCLE_Map = new TreeMap<>();
    static {
        for (String node : NODES) {
            int index = hash(node);
            System.out.println(node + "节点的哈希值为:" + index);
            CIRCLE_Map.put(index, node);
        }
    }
    public static String loadBalance(String key) {
        int index2 = hash(key);
        //返回一个大于或等于index2的map
        SortedMap<Integer, String> tailMap = CIRCLE_Map.tailMap(index2);
        //如果tailMap为空，则直接返回哈希表的第一个数据
        if (tailMap.isEmpty()) {
            return CIRCLE_Map.get(CIRCLE_Map.firstKey());
        } else {
            //第一个Key就是顺时针过去离node最近的那个结点
            return CIRCLE_Map.get(tailMap.firstKey());
        }
    }
    private static int hash(String key) {
        ........
        ........
    }

    public static void main(String[] args) {
        System.out.println("zsh被路由到的节点为:" + loadBalance("zsh"));
    }
}