深入理解GeeCache分布式缓存：第五天实现分布式节点-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00736/article/details/148375963

深入理解GeeCache分布式缓存：第五天实现分布式节点

7days-golang 7 days golang programs from scratch (web framework Gee, distributed cache GeeCache, object relational mapping ORM framework GeeORM, rpc framework GeeRPC etc) 7天用Go动手写/从零实现系列项目地址: https://gitcode.com/gh_mirrors/7d/7days-golang

前言

在分布式缓存系统的开发过程中，节点间的通信与协作是核心挑战之一。本文将深入探讨如何为GeeCache实现分布式节点功能，包括节点注册、一致性哈希选择节点以及HTTP客户端与服务端的交互。

分布式缓存架构回顾

在GeeCache的前几天实现中，我们已经完成了单机版的缓存系统，主要包括：

缓存值的存储与获取
LRU缓存淘汰策略
缓存未命中时的回调处理

现在，我们需要将其扩展为分布式系统，主要解决以下问题：

如何将数据分布到多个节点上？
如何快速定位数据所在的节点？
节点间如何进行高效通信？

一致性哈希算法应用

一致性哈希算法是分布式系统中常用的数据分布算法，它具有以下优点：

平衡性：哈希结果尽可能分布到所有节点
单调性：新增或删除节点时，只需重新映射少量数据
分散性：相同内容尽可能映射到相同节点

在GeeCache中，我们使用一致性哈希算法来选择数据应该存储在哪个节点上。每个节点对应哈希环上的一个点，当需要查询某个key时，计算key的哈希值，顺时针找到最近的节点。

核心接口设计

为了实现分布式功能，我们定义了两个关键接口：

type PeerPicker interface {
    PickPeer(key string) (peer PeerGetter, ok bool)
}

type PeerGetter interface {
    Get(group string, key string) ([]byte, error)
}

PeerPicker：负责根据key选择对应的节点
PeerGetter：负责从远程节点获取数据

这种接口设计遵循了依赖倒置原则，使得我们可以灵活替换不同的实现方式。

HTTP通信实现

我们选择HTTP作为节点间通信协议，主要考虑：

协议简单，易于实现和调试
跨语言兼容性好
天然支持分布式环境

HTTP客户端实现

httpGetter实现了PeerGetter接口，主要功能是向远程节点发起HTTP请求：

func (h *httpGetter) Get(group string, key string) ([]byte, error) {
    u := fmt.Sprintf("%v%v/%v", h.baseURL, url.QueryEscape(group), url.QueryEscape(key))
    res, err := http.Get(u)
    // 处理响应...
}

HTTP服务端增强

HTTPPool现在不仅作为HTTP服务端，还实现了PeerPicker接口：

func (p *HTTPPool) Set(peers ...string) {
    p.peers = consistenthash.New(defaultReplicas, nil)
    p.peers.Add(peers...)
    p.httpGetters = make(map[string]*httpGetter)
    // 为每个节点创建httpGetter
}

主流程集成

在Group结构中新增了节点相关功能：

func (g *Group) load(key string) (value ByteView, err error) {
    if g.peers != nil {
        if peer, ok := g.peers.PickPeer(key); ok {
            if value, err = g.getFromPeer(peer, key); err == nil {
                return value, nil
            }
        }
    }
    return g.getLocally(key)
}

这个流程实现了：

首先尝试从远程节点获取
失败则回退到本地处理

测试与验证

我们通过启动多个节点来测试分布式功能：

func startCacheServer(addr string, addrs []string, gee *geecache.Group) {
    peers := geecache.NewHTTPPool(addr)
    peers.Set(addrs...)
    gee.RegisterPeers(peers)
    http.ListenAndServe(addr[7:], peers)
}

测试结果显示，相同的key会被路由到同一个节点，验证了一致性哈希的效果。