Dubbo的容错机制原理

本文基于 Apache Dubbo 2.7.0 版本源码和官网集群章节,介绍了 Dubbo 集群容错机制。先说明了选择集群容错方式,可通过设置标签属性匹配。集群容错发生在消费端,调用前有查询、路由等前置动作。还详细阐述了 Failover、Failback 等多种容错机制的原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 本文是基于 apache dubbo 2.7.0 版本的源码和参考官网的集群章节而成。



 为了避免单点故障,现在的应用通常至少会部署在两台服务器上。对于一些负载比较高的服务,会部署更多的服务器。这样,在同一环境下的服务提供者数量会大于1。对于服务消费者来说,同一环境下出现了多个服务提供者。这时会出现一个问题,服务消费者需要决定选择哪个服务提供者进行调用。另外服务调用失败时的处理措施也是需要考虑的,是重试呢,还是抛出异常,亦或是只打印异常等。为了处理这些问题,Dubbo 定义了集群接口 Cluster 以及 Cluster Invoker。集群 Cluster 用途是将多个服务提供者合并为一个 Cluster Invoker,并将这个 Invoker 暴露给服务消费者。这样一来,服务消费者只需通过这个 Invoker 进行远程调用即可,至于具体调用哪个服务提供者,以及调用失败后如何处理等问题,现在都交给集群模块去处理。集群模块是服务提供者和服务消费者的中间层,为服务消费者屏蔽了服务提供者的情况,这样服务消费者就可以专心处理远程调用相关事宜。比如发请求,接受服务提供者返回的数据等。这就是集群的作用。

一 选择集群容错方式

 集群容错机制是交由 org.apache.dubbo.rpc.cluster.Cluster 接口的子类处理,为了清楚该接口有哪些扩展类,不妨打开该类的 Dubbo SPI 配置文件(扩展点的全限定名)一观:

mock=org.apache.dubbo.rpc.cluster.support.wrapper.MockClusterWrapper
failover=org.apache.dubbo.rpc.cluster.support.FailoverCluster
failfast=org.apache.dubbo.rpc.cluster.support.FailfastCluster
failsafe=org.apache.dubbo.rpc.cluster.support.FailsafeCluster
failback=org.apache.dubbo.rpc.cluster.support.FailbackCluster
forking=org.apache.dubbo.rpc.cluster.support.ForkingCluster
available=org.apache.dubbo.rpc.cluster.support.AvailableCluster
mergeable=org.apache.dubbo.rpc.cluster.support.MergeableCluster
broadcast=org.apache.dubbo.rpc.cluster.support.BroadcastCluster
registryaware=org.apache.dubbo.rpc.cluster.support.RegistryAwareCluster

 理论上来说,Dubbo 的集群容错机制就有以上 10 种,且还可从 Cluster 接口上的 @SPI 可知,其默认的扩展类为 FailoverCluster

@SPI(FailoverCluster.NAME)
public interface Cluster {

    @Adaptive
    <T> Invoker<T> join(Directory<T> directory) throws RpcException;
}

 那么在真正调用时,可通过设置 <dubbo:service> 标签中 cluster 属性,其值分别对应Cluster 扩展点配置文件中的 key,以匹配对应的容错机制。

二 前置动作

 集群容错真正发生在消费端。当消费端发起调用时,会先从服务目录查询满足需求的服务提供者信息,在此基础上进行路由,路由后的结果才会真正进行容错处理。所以,就会有如下的活动图:
集群容错前置动作

三 容错机制原理

3.1 Failover Cluster

失败自动切换机制是由 FailoverClusterInvoker 类控制。在调用失败时,会自动切换服务提供者信息进行重试。通常用于操作,但重试会带来更长延迟。默认配置下,Dubbo 会使用这种机制作为缺省集群容错机制。下图展示了 Failover Cluster 机制的工作原理。
Dubbo的失败自动切换容错机制
 如上,首先是获取重试次数,然后根据重试次数进行循环调用,失败后进行重试。在循环内,首先是通过负载均衡组件选择一个 Invoker,然后再通过这个 Invoker 的 invoke 方法进行远程调用。如果失败了,记录下异常,并进行重试。

 在源码中是通过如下代码获取重试次数:

int len=getUrl().getMethodParameter(methodName, Constants.RETRIES_KEY,Constants.DEFAULT_RETRIES)+1;

 其中,常量 Constants.RETRIES_KEY 的值为 “retries”,Constants.DEFAULT_RETRIES 的值为 2。表示:从 url 中获取该方法中 retries 属性的值,值为空时取默认值 2。但是在最后还有一个 +1 的动作,表示获取的最终值为 重试次数 + 1,即执行远程调用的最大次数为重试次数 + 1次。

3.2 Failback Cluster

失败自动恢复会在调用失败后,返回一个空结果给服务消费者。并通过定时任务对失败的调用进行重试,适合执行消息通知等操作。下面来看一下它的实现逻辑。
Dubbo的失败自动恢复容错机制

3.3 Failfast Cluster

快速失败只会进行一次调用,失败后立即抛出异常。适用于幂等操作,比如新增记录。实现逻辑如下:
Dubbo的快速失败容错机制

3.4 Failsafe Cluster

失败安全是指,当调用过程中出现异常时,仅会打印异常,而不会抛出异常。适用于写入审计日志等操作。
Dubbo的失败安全容错机制

3.5 Forking Cluster

并行调用多个服务提供者会在运行时通过线程池创建多个线程,并发调用多个服务提供者。只要有一个服务提供者成功返回了结果,doInvoke 方法就会立即结束运行。ForkingClusterInvoker 的应用场景是在一些对实时性要求比较高读操作(注意是读操作,并行写操作可能不安全)下使用,但这将会耗费更多的资源。下面来看该类的实现原理。
Dubbo的并行调用多个服务提供者容错机制

3.6 Broadcast Cluster

 BroadcastClusterInvoker 会逐个调用每个服务提供者,如果其中一台报错,再循环调用结束后,BroadcastClusterInvoker 会抛出异常。该类通常用于通知所有提供者更新缓存或日志等本地资源信息。
Dubbo的广播方式容错机制
TODO
 其他的容错机制原理待补充。

### Dubbo 分布式服务框架的原理与工作机制 Dubbo 是一个高性能、轻量级的开源 Java RPC 框架,旨在提供高效的远程服务调用解决方案,并支持自动化的服务注册与发现功能[^1]。它的设计目标是帮助开发者快速构建分布式服务体系,同时在大规模微服务环境中提供强大的治理能力。 #### 1. Dubbo 的架构概述 Dubbo 的整体架构由多个核心组件构成,这些组件共同协作以完成服务的发布、调用以及管理。以下是其主要组成部分及其作用: - **Provider**: 提供者节点负责暴露服务接口并将其注册到注册中心。 - **Consumer**: 消费者节点通过向注册中心查询来获取可用的服务列表,并发起远程调用请求。 - **Registry**: 注册中心用于存储服务地址信息,充当 Provider 和 Consumer 之间的桥梁。 - **Monitor**: 监控中心记录服务调用次数和耗时等指标数据,便于后续分析和服务优化。 - **Container**: 容器环境承载着整个 Dubbo 应用程序运行所需的资源和支持。 这种分层的设计使得 Dubbo 可以灵活应对不同规模的应用场景需求[^3]。 #### 2. RPC 调用流程详解 RPC (Remote Procedure Call) 即远程过程调用,是一种让客户端像调用本地方法一样访问远端服务器上的某个函数的技术[^2]。具体而言,在 Dubbo 中实现了一个完整的 RPC 流程如下所示: 1. 当消费者想要调用某项服务时,它会先从配置文件或者动态加载的方式得知该服务对应的 Stub 接口定义; 2. 随后利用代理模式创建出针对此接口的一个实例对象——即所谓的 Client Proxy; 3. 在实际执行过程中,当用户操作这个代理对象的时候,底层便会触发一系列逻辑处理动作,包括但不限于参数序列化打包成字节流形式发送给指定的目标机器; 4. 对方接收到消息之后再经过反序列化解析还原原始输入值交给真正的业务处理器去响应请求最后把结果返回回去同样经历类似的转换步骤直至最终呈现给最初发出指令的一方为止。 下面是简化版伪代码表示这一交互行为: ```java // Service Interface Definition public interface HelloService { String sayHello(String name); } // On the consumer side, create a proxy instance of the service. HelloService helloService = ReferenceConfig.getProxy(HelloService.class); // Invoke remote method as if it were local call. String result = helloService.sayHello("World"); System.out.println(result); // Output: Hello World! ``` 在此期间涉及到的关键技术点还有诸如如何选择合适的连接池大小?怎样设置超时时间防止长时间等待影响用户体验等问题都需要仔细考量才能达到最佳效果[^2]。 #### 3. 核心机制剖析 为了更好地理解 Dubbo 工作机制背后隐藏的秘密,下面重点介绍几个重要方面: ##### (1)通信协议支持 Dubbo 支持多种不同的传输协议,默认采用的是 dubbo:// 方案,这是一种基于 TCP 的私有二进制协议,相比起 HTTP 来说效率更高因为少了大量冗余头部信息开销;当然也允许切换至其他选项比如 hessian:// 或 restful api 形式的 json-rpc 等满足特定场合下的特殊要求。 ##### (2)序列化方式多样性 考虑到跨平台兼容性问题以及性能因素考虑,Dubbo 内置了几种主流的数据编码格式可供挑选例如 fastjson、protobuf 等以便于适应各类复杂度各异的任务负载情况之下均能找到平衡点达成理想状态。 ##### (3)负载均衡算法 为了让流量均匀分布减少单点压力提高系统稳定性,Dubbo 实现了一系列内置策略其中包括随机法(Random LoadBalance),轮询(RoundRobinLoadBalance),最少活跃数(LeastActiveLoadBalance)等等可根据实际情况自由组合运用从而获得最优解路径规划方案。 ##### (4)容错处理机制 面对不可避免的各种异常状况发生可能性,提前做好预案显得尤为重要因此 Dubbo 设计了一套完善的错误恢复体系涵盖重试(Failover Cluster), 忽略失败(Failsafe Cluster), 广播通知(Broadcast Cluster)等多种类型确保即使部分节点出现问题也不会导致全局瘫痪局面出现维持正常运转秩序不变样[^3]。 --- ###
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值