Nacos Naming Service 设计原理 && 底层代码 详解

Nacos(Naming Configuration Service)是阿里巴巴开源的一个动态服务发现、配置管理和服务管理平台。其中,Nacos Naming Service 是其核心模块之一,负责服务注册、发现、健康检查、负载均衡等功能。

本文将深入解析 Nacos Naming Service 的设计原理,并结合 底层代码实现(以 Nacos 2.0+ 版本为主)进行详细剖析。


一、Nacos Naming Service 设计原理

1. 核心功能

Nacos Naming Service 主要提供以下功能:

功能说明
服务注册服务实例启动后向 Nacos 注册自己
服务发现客户端获取某个服务的所有可用实例
健康检查自动检测服务实例的存活状态
负载均衡提供客户端或服务端的负载均衡策略
服务元数据管理支持服务标签、权重、版本等元信息
临时/持久化实例支持基于心跳的临时实例(ephemeral)和持久化实例(persistent)

2. 架构设计

Nacos 的命名服务采用 Client-Server 架构 + 分层设计,支持集群部署与高可用。

2.1 整体架构图(简化)
+----------------+     +------------------+     +------------------+
|   Client SDK     |<--->|   Nacos Server     |<--->|   Nacos Server     |
| (Spring Cloud    |     | (Naming Module)    |     | (Naming Module)    |
|  Alibaba, etc.)  |     +------------------+     +------------------+
+----------------+               |                          |
                                 v                          v
                         +------------------+     +------------------+
                         |   Data Storage     |     |   Data Storage     |
                         | (Derby/MySQL)      |     | (Derby/MySQL)      |
                         +------------------+     +------------------+
2.2 关键组件
组件职责
NamingController接收 HTTP 请求,处理注册、查询等
InstanceOperatorService实例操作接口(注册、删除、更新)
PushService向客户端推送服务变更
HealthCheckService负责健康检查(TCP/HTTP/Client Beat)
ConsistencyService一致性协议层(Distro + Raft)
DistroProtocol管理临时实例的同步(基于 Distro 协议)
RaftProtocol管理持久化实例的强一致性(Raft)
ServiceManager管理服务的生命周期,懒加载/清理
ClientManager管理客户端连接与心跳

3. 服务注册与发现流程

3.1 服务注册(Register)
  1. 客户端调用 /nacos/v1/ns/instance 发起注册。
  2. Nacos Server 接收请求,校验参数。
  3. 判断实例类型:
    • 临时实例(Ephemeral):使用 Distro 协议同步到其他节点。
    • 持久实例(Persistent):使用 Raft 协议写入日志并同步。
  4. 将实例信息存入内存中的 Service 对象(ConsistencyService 负责存储)。
  5. 触发变更通知(Push)。
3.2 服务发现(Discover)
  1. 客户端调用 /nacos/v1/ns/instance/list 查询服务。
  2. Server 从内存中获取服务实例列表。
  3. 根据健康状态、权重、集群等过滤。
  4. 返回可用实例列表(支持 JSON 或 LongPolling)。
3.3 健康检查机制
  • 临时实例:依赖客户端心跳(每5秒一次)。
    • 服务端每5秒检查一次心跳时间。
    • 超过15秒未收到心跳,标记为不健康,30秒未恢复则剔除。
  • 持久实例:使用服务端主动探测(TCP/HTTP/MySQL)。

4. 一致性协议设计

Nacos 根据实例类型选择不同的一致性协议:

实例类型一致性协议特点
临时实例Distro 协议(类Gossip)写扩散,最终一致性,高性能
持久实例Raft 协议强一致性,CP 模型,适合关键服务

💡 为什么区分?

  • 临时实例数量大、变化频繁,适合 AP 模型。
  • 持久实例要求强一致,适合 CP 模型。

二、底层代码详解(Nacos 2.0+)

我们以 服务注册 为例,逐步剖析源码。

1. 入口:NamingController

文件:com.alibaba.nacos.naming.web.NamingController

@PostMapping("/instance")
public String register(HttpServletRequest request) throws Exception {
    final String namespaceId = WebUtils.optional(request, "namespaceId", Constants.DEFAULT_NAMESPACE_ID);
    final String serviceName = request.getParameter("serviceName");
    final Instance instance = parseInstance(request); // 解析实例参数

    serviceManager.registerInstance(namespaceId, serviceName, instance); // 核心注册逻辑
    return "ok";
}

所有注册请求最终调用 ServiceManager.registerInstance()


2. ServiceManager.registerInstance

文件:com.alibaba.nacos.naming.core.ServiceManager

public void registerInstance(String namespaceId, String serviceName, Instance instance) throws NacosException {
    createEmptyService(namespaceId, serviceName, instance.isEphemeral()); // 创建服务(若不存在)

    Service service = getService(namespaceId, serviceName);
    if (service == null) {
        throw new NacosException(NacosException.SERVER_ERROR, "service not found");
    }

    // 委托给 InstanceOperatorClientImpl
    instanceService.registerInstance(namespaceId, serviceName, instance);
}

createEmptyService() 会根据 ephemeral 参数决定使用 Distro 或 Raft。


3. InstanceOperatorClientImpl

文件:com.alibaba.nacos.naming.core.InstanceOperatorClientImpl

@Override
public void registerInstance(String namespaceId, String serviceName, Instance instance) throws NacosException {
    Service service = serviceFactory.createOrGetService(namespaceId, serviceName, instance.isEphemeral());
    // 获取一致性协议代理
    ConsistencyService consistencyService = instance.isEphemeral() 
        ? consistencyServiceDelegate.getProtocol(DistroConsistencyService.class) 
        : consistencyServiceDelegate.getProtocol(RaftConsistencyService.class);

    // 构造数据 key
    String key = buildInstanceKey(namespaceId, serviceName, instance.getIp(), instance.getPort());
    consistencyService.put(key, instance); // 异步写入一致性层
}

这里是关键:根据实例类型选择不同的 ConsistencyService


4. DistroConsistencyService(临时实例)

文件:com.alibaba.nacos.naming.consistency.ephemeral.distro.DistroConsistencyServiceImpl

@Override
public void put(String key, Record value) throws NacosException {
    onPut(key, value); // 更新本地内存
    distroProtocol.sync(new DistroKey(key), DataOperation.CHANGE, 1000L); // 异步同步到其他节点
}

public void onPut(String key, Record value) {
    if (value instanceof Instance) {
        // 存入内存:service -> cluster -> instance
        addInstanceToService(key, (Instance) value);
    }
}
  • onPut() 更新本地内存。
  • distroProtocol.sync() 触发 Distro 同步任务。

5. DistroProtocol 同步机制

文件:com.alibaba.nacos.naming.distro.DistroProtocol

public void sync(DistroKey key, DataOperation action, long delay) {
    for (Member member : memberManager.allMembers()) {
        if (member.getAddress().equals(localAddress)) continue;
        // 提交同步任务到线程池
        distroTaskEngine.sync(new DistroDataSyncTask(key, member, action, delay));
    }
}
  • 使用 DistroTaskEngine 异步分发同步任务。
  • 每个任务通过 HTTP 向其他节点推送数据变更。

6. 健康检查:HealthCheckReactor

文件:com.alibaba.nacos.naming.healthcheck.HealthCheckReactor

public class HealthCheckReactor {
    public static void scheduleCheck(HealthCheckTask task) {
        // 每5秒调度一次
        GlobalExecutor.scheduleHealthCheck(new Runnable() {
            @Override
            public void run() {
                healthChecker.check(task); // 执行检查
            }
        }, 5000, 5000);
    }
}
  • 临时实例:检查客户端心跳时间。
  • 持久实例:发起 TCP/HTTP 探测。

7. 服务发现:查询逻辑

文件:com.alibaba.nacos.naming.controllers.InstanceController

@GetMapping("/list")
public JSONObject list(HttpServletRequest request) {
    String namespaceId = WebUtils.optional(request, "namespaceId", Constants.DEFAULT_NAMESPACE_ID);
    String serviceName = request.getParameter("serviceName");
    
    Service service = serviceManager.getService(namespaceId, serviceName);
    List<Instance> hosts = service.allIPs(); // 获取所有实例

    // 过滤健康实例
    List<Instance> healthyList = hosts.stream()
        .filter(Instance::isHealthy)
        .collect(Collectors.toList());

    JSONObject result = new JSONObject();
    result.put("hosts", healthyList);
    return result;
}

8. 数据存储结构

Nacos 将服务数据存储在内存中,结构如下:

class Service {
    private String namespaceId;
    private String serviceName;
    private Map<String, Cluster> clusterMap; // 集群映射
    private volatile boolean healthy = true;
}

class Cluster {
    private String name;
    private List<Instance> instances;
}

class Instance {
    private String ip;
    private int port;
    private boolean healthy;
    private long lastBeat; // 最后心跳时间
    private double weight;
}

所有数据变更通过一致性协议同步,持久化存储(MySQL)仅用于 Raft 日志和配置。


三、关键设计亮点

1. 混合一致性模型(Distro + Raft)

  • Distro:为临时实例设计,写扩散 + 最终一致,适合高并发注册。
  • Raft:为持久实例设计,强一致,适合金融级服务。

2. 内存为主,极致性能

  • 所有服务数据常驻内存,读写极快。
  • 持久化仅用于故障恢复。

3. 轻量级 Push 机制

  • 使用 HTTP Long Polling 实现服务变更推送。
  • 客户端保持长连接,服务端有变更时立即返回。

4. 可插拔一致性协议

通过 ConsistencyService 接口抽象,支持多协议扩展。

public interface ConsistencyService {
    void put(String key, Record value);
    void remove(String key);
    void listen(String key, RecordListener listener);
}

四、总结

特性说明
高性能内存存储 + Distro 协议,支持百万级服务注册
高可用集群部署,自动故障转移
灵活一致性根据实例类型选择 AP 或 CP
易扩展插件化设计,支持自定义健康检查、负载均衡等

五、参考资料

  1. Nacos GitHub 官方仓库:https://github.com/alibaba/nacos
  2. Nacos 架构文档:https://nacos.io/zh-cn/docs/architecture.html
  3. Distro 协议设计论文(内部)
  4. Nacos 2.0 升级说明:支持 gRPC、性能优化
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值