Nacos(Naming Configuration Service)是阿里巴巴开源的一个动态服务发现、配置管理和服务管理平台。其中,Nacos Naming Service 是其核心模块之一,负责服务注册、发现、健康检查、负载均衡等功能。
本文将深入解析 Nacos Naming Service 的设计原理,并结合 底层代码实现(以 Nacos 2.0+ 版本为主)进行详细剖析。
一、Nacos Naming Service 设计原理
1. 核心功能
Nacos Naming Service 主要提供以下功能:
| 功能 | 说明 |
|---|---|
| 服务注册 | 服务实例启动后向 Nacos 注册自己 |
| 服务发现 | 客户端获取某个服务的所有可用实例 |
| 健康检查 | 自动检测服务实例的存活状态 |
| 负载均衡 | 提供客户端或服务端的负载均衡策略 |
| 服务元数据管理 | 支持服务标签、权重、版本等元信息 |
| 临时/持久化实例 | 支持基于心跳的临时实例(ephemeral)和持久化实例(persistent) |
2. 架构设计
Nacos 的命名服务采用 Client-Server 架构 + 分层设计,支持集群部署与高可用。
2.1 整体架构图(简化)
+----------------+ +------------------+ +------------------+
| Client SDK |<--->| Nacos Server |<--->| Nacos Server |
| (Spring Cloud | | (Naming Module) | | (Naming Module) |
| Alibaba, etc.) | +------------------+ +------------------+
+----------------+ | |
v v
+------------------+ +------------------+
| Data Storage | | Data Storage |
| (Derby/MySQL) | | (Derby/MySQL) |
+------------------+ +------------------+
2.2 关键组件
| 组件 | 职责 |
|---|---|
| NamingController | 接收 HTTP 请求,处理注册、查询等 |
| InstanceOperatorService | 实例操作接口(注册、删除、更新) |
| PushService | 向客户端推送服务变更 |
| HealthCheckService | 负责健康检查(TCP/HTTP/Client Beat) |
| ConsistencyService | 一致性协议层(Distro + Raft) |
| DistroProtocol | 管理临时实例的同步(基于 Distro 协议) |
| RaftProtocol | 管理持久化实例的强一致性(Raft) |
| ServiceManager | 管理服务的生命周期,懒加载/清理 |
| ClientManager | 管理客户端连接与心跳 |
3. 服务注册与发现流程
3.1 服务注册(Register)
- 客户端调用
/nacos/v1/ns/instance发起注册。 - Nacos Server 接收请求,校验参数。
- 判断实例类型:
- 临时实例(Ephemeral):使用 Distro 协议同步到其他节点。
- 持久实例(Persistent):使用 Raft 协议写入日志并同步。
- 将实例信息存入内存中的
Service对象(ConsistencyService负责存储)。 - 触发变更通知(Push)。
3.2 服务发现(Discover)
- 客户端调用
/nacos/v1/ns/instance/list查询服务。 - Server 从内存中获取服务实例列表。
- 根据健康状态、权重、集群等过滤。
- 返回可用实例列表(支持 JSON 或 LongPolling)。
3.3 健康检查机制
- 临时实例:依赖客户端心跳(每5秒一次)。
- 服务端每5秒检查一次心跳时间。
- 超过15秒未收到心跳,标记为不健康,30秒未恢复则剔除。
- 持久实例:使用服务端主动探测(TCP/HTTP/MySQL)。
4. 一致性协议设计
Nacos 根据实例类型选择不同的一致性协议:
| 实例类型 | 一致性协议 | 特点 |
|---|---|---|
| 临时实例 | Distro 协议(类Gossip) | 写扩散,最终一致性,高性能 |
| 持久实例 | Raft 协议 | 强一致性,CP 模型,适合关键服务 |
💡 为什么区分?
- 临时实例数量大、变化频繁,适合 AP 模型。
- 持久实例要求强一致,适合 CP 模型。
二、底层代码详解(Nacos 2.0+)
我们以 服务注册 为例,逐步剖析源码。
1. 入口:NamingController
文件:com.alibaba.nacos.naming.web.NamingController
@PostMapping("/instance")
public String register(HttpServletRequest request) throws Exception {
final String namespaceId = WebUtils.optional(request, "namespaceId", Constants.DEFAULT_NAMESPACE_ID);
final String serviceName = request.getParameter("serviceName");
final Instance instance = parseInstance(request); // 解析实例参数
serviceManager.registerInstance(namespaceId, serviceName, instance); // 核心注册逻辑
return "ok";
}
所有注册请求最终调用
ServiceManager.registerInstance()。
2. ServiceManager.registerInstance
文件:com.alibaba.nacos.naming.core.ServiceManager
public void registerInstance(String namespaceId, String serviceName, Instance instance) throws NacosException {
createEmptyService(namespaceId, serviceName, instance.isEphemeral()); // 创建服务(若不存在)
Service service = getService(namespaceId, serviceName);
if (service == null) {
throw new NacosException(NacosException.SERVER_ERROR, "service not found");
}
// 委托给 InstanceOperatorClientImpl
instanceService.registerInstance(namespaceId, serviceName, instance);
}
createEmptyService()会根据ephemeral参数决定使用 Distro 或 Raft。
3. InstanceOperatorClientImpl
文件:com.alibaba.nacos.naming.core.InstanceOperatorClientImpl
@Override
public void registerInstance(String namespaceId, String serviceName, Instance instance) throws NacosException {
Service service = serviceFactory.createOrGetService(namespaceId, serviceName, instance.isEphemeral());
// 获取一致性协议代理
ConsistencyService consistencyService = instance.isEphemeral()
? consistencyServiceDelegate.getProtocol(DistroConsistencyService.class)
: consistencyServiceDelegate.getProtocol(RaftConsistencyService.class);
// 构造数据 key
String key = buildInstanceKey(namespaceId, serviceName, instance.getIp(), instance.getPort());
consistencyService.put(key, instance); // 异步写入一致性层
}
这里是关键:根据实例类型选择不同的
ConsistencyService。
4. DistroConsistencyService(临时实例)
文件:com.alibaba.nacos.naming.consistency.ephemeral.distro.DistroConsistencyServiceImpl
@Override
public void put(String key, Record value) throws NacosException {
onPut(key, value); // 更新本地内存
distroProtocol.sync(new DistroKey(key), DataOperation.CHANGE, 1000L); // 异步同步到其他节点
}
public void onPut(String key, Record value) {
if (value instanceof Instance) {
// 存入内存:service -> cluster -> instance
addInstanceToService(key, (Instance) value);
}
}
onPut()更新本地内存。distroProtocol.sync()触发 Distro 同步任务。
5. DistroProtocol 同步机制
文件:com.alibaba.nacos.naming.distro.DistroProtocol
public void sync(DistroKey key, DataOperation action, long delay) {
for (Member member : memberManager.allMembers()) {
if (member.getAddress().equals(localAddress)) continue;
// 提交同步任务到线程池
distroTaskEngine.sync(new DistroDataSyncTask(key, member, action, delay));
}
}
- 使用
DistroTaskEngine异步分发同步任务。 - 每个任务通过 HTTP 向其他节点推送数据变更。
6. 健康检查:HealthCheckReactor
文件:com.alibaba.nacos.naming.healthcheck.HealthCheckReactor
public class HealthCheckReactor {
public static void scheduleCheck(HealthCheckTask task) {
// 每5秒调度一次
GlobalExecutor.scheduleHealthCheck(new Runnable() {
@Override
public void run() {
healthChecker.check(task); // 执行检查
}
}, 5000, 5000);
}
}
- 临时实例:检查客户端心跳时间。
- 持久实例:发起 TCP/HTTP 探测。
7. 服务发现:查询逻辑
文件:com.alibaba.nacos.naming.controllers.InstanceController
@GetMapping("/list")
public JSONObject list(HttpServletRequest request) {
String namespaceId = WebUtils.optional(request, "namespaceId", Constants.DEFAULT_NAMESPACE_ID);
String serviceName = request.getParameter("serviceName");
Service service = serviceManager.getService(namespaceId, serviceName);
List<Instance> hosts = service.allIPs(); // 获取所有实例
// 过滤健康实例
List<Instance> healthyList = hosts.stream()
.filter(Instance::isHealthy)
.collect(Collectors.toList());
JSONObject result = new JSONObject();
result.put("hosts", healthyList);
return result;
}
8. 数据存储结构
Nacos 将服务数据存储在内存中,结构如下:
class Service {
private String namespaceId;
private String serviceName;
private Map<String, Cluster> clusterMap; // 集群映射
private volatile boolean healthy = true;
}
class Cluster {
private String name;
private List<Instance> instances;
}
class Instance {
private String ip;
private int port;
private boolean healthy;
private long lastBeat; // 最后心跳时间
private double weight;
}
所有数据变更通过一致性协议同步,持久化存储(MySQL)仅用于 Raft 日志和配置。
三、关键设计亮点
1. 混合一致性模型(Distro + Raft)
- Distro:为临时实例设计,写扩散 + 最终一致,适合高并发注册。
- Raft:为持久实例设计,强一致,适合金融级服务。
2. 内存为主,极致性能
- 所有服务数据常驻内存,读写极快。
- 持久化仅用于故障恢复。
3. 轻量级 Push 机制
- 使用 HTTP Long Polling 实现服务变更推送。
- 客户端保持长连接,服务端有变更时立即返回。
4. 可插拔一致性协议
通过 ConsistencyService 接口抽象,支持多协议扩展。
public interface ConsistencyService {
void put(String key, Record value);
void remove(String key);
void listen(String key, RecordListener listener);
}
四、总结
| 特性 | 说明 |
|---|---|
| 高性能 | 内存存储 + Distro 协议,支持百万级服务注册 |
| 高可用 | 集群部署,自动故障转移 |
| 灵活一致性 | 根据实例类型选择 AP 或 CP |
| 易扩展 | 插件化设计,支持自定义健康检查、负载均衡等 |
五、参考资料
- Nacos GitHub 官方仓库:https://github.com/alibaba/nacos
- Nacos 架构文档:https://nacos.io/zh-cn/docs/architecture.html
- Distro 协议设计论文(内部)
- Nacos 2.0 升级说明:支持 gRPC、性能优化
1132

被折叠的 条评论
为什么被折叠?



