初学SpringCloud之Hystrix

最新推荐文章于 2025-06-17 17:33:25 发布

原创最新推荐文章于 2025-06-17 17:33:25 发布 · 260 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#java

本文探讨了微服务架构下面对高并发场景的问题与解决方案，包括服务隔离、熔断降级、限流等核心知识。介绍了Hystrix作为延迟和容错库的作用，以及如何在Feign调用中配置熔断，实现服务的自我保护，提升系统稳定性。

一、高并发问题：模拟环境

1.1，我们先创建好相关工程，还是用订单服务(order_service)调用商品服务(product_service)，如下：

我们都知道，一个Tomcat可以承受的并发量肯定是有限的，这里为了更好的演示问题，我设置为支持10个线程同时访问

OrderController中的方法：

@RestController
@RequestMapping("/order")
public class OrderController {
	@Autowired
	private RestTemplate restTemplate;
	/**
	 * 使用OrderCommand调用远程服务
	 */
	@RequestMapping(value = "/buy/{id}",method = RequestMethod.GET)
	public Product findById(@PathVariable Long id) {
		return new OrderCommand(restTemplate,id).execute();
	}

    //直接正常返回，与上面远程调用对比
	@RequestMapping(value = "/{id}",method = RequestMethod.GET)
	public String findOrder(@PathVariable Long id) {
		System.out.println(Thread.currentThread().getName());
		return "根据id查询订单";
	}
}

ProductController的方法：

@RequestMapping(value = "/{id}",method = RequestMethod.GET)
	public Product findById(@PathVariable Long id) {
		try {
			Thread.sleep(2000l);
		} catch (InterruptedException e) {
			e.printStackTrace();
		}
		Product product = productService.findById(id);
		product.setProductName("访问的服务地址:"+ip + ":" + port);
		return product;
	}

我们调用Thread.sleep(20001)模拟现实是网络出现波动休眠两秒,

1.2，jmeter模拟高负载存在的问题

Apache官网下载jmetter并配置模拟发送请求即可

(1)配置同一时刻50个线程发送请求，每个线程循环50次

(2)配置http请求

(3)发送，观察现象

我们用JMter发送2500个请求同时(我们发送的是findById这个请求，休眠两秒)，同时我们打开浏览器访问findOrder这个接口(这个接口理论是正常马上返回)，但实际我们等了8秒左右

二、高并发问题分析

采用隔离的方式，我们可以设置每个微服务方法最大阈值，超过阈值在访问就直接响应错误页面，这样就避免了过多请求积压导致系统崩溃，并且也不会影响其他方法正常的响应。

三、服务熔断

3.1，服务容错的核心知识

3.1.1，雪崩效应

在微服务架构中，一个请求需要调用多个服务是非常常见的。如客户端访问A服务，而A服务需要调用B服务，B服务需要调用C服务，由于网络原因或者自身的原因，如果B服务或者C服务不能及时响应，A服务将处于阻塞状态，直到B服务C服务响应。此时若有大量的请求涌入，容器的线程资源会被消耗完毕，导致服务瘫痪。服务与服务之间的依赖性，故障会传播，造成连锁反应，会对整个微服务系统造成灾难性的严重后果，这就是服务故障的“雪崩”效应。我们可以提前评估，做好熔断，隔离，限流。

3.1.2，服务隔离

它是指将系统按照一定的原则划分为若干个服务模块，各个模块之间相对独立，无强依赖。当有故障发生时，能将问题和影响隔离在某个模块内部，而不扩散风险，不波及其它模块，不影响整体的系统服务。

3.1.3，熔断降级

熔断这一概念来源于电子工程中的断路器（Circuit Breaker）。在互联网系统中，当下游服务因访问压力过大而响应变慢或失败，上游服务为了保护系统整体的可用性，可以暂时切断对下游服务的调用。这种牺牲局部，保全整体的措施就叫做熔断。

所谓降级，就是当某个服务熔断之后，服务器将不再被调用，此时客户端可以自己准备一个本地的
fallback回调，返回一个缺省值。

3.1.4，服务限流

限流可以认为服务降级的一种，限流就是限制系统的输入和输出流量已达到保护系统的目的。一般来说系统的吞吐量是可以被测算的，为了保证系统的稳固运行，一旦达到的需要限制的阈值，就需要限制流量并采取少量措施以完成限制流量的目的。比方：推迟解决，拒绝解决，或者者部分拒绝解决等等。

四、Hystrix介绍

Hystrix是由Netflix开源的一个延迟和容错库，用于隔离访问远程系统、服务或者第三方库，防止级联失败，从而提升系统的可用性与容错性。Hystrix主要通过以下几点实现延迟和容错。
包裹请求：使用HystrixCommand包裹对依赖的调用逻辑，每个命令在独立线程中执行。这使用了设计模式中的“命令模式”。
跳闸机制：当某服务的错误率超过一定的阈值时，Hystrix可以自动或手动跳闸，停止请求该服务一段时间。
资源隔离：Hystrix为每个依赖都维护了一个小型的线程池（或者信号量）。如果该线程池已满，发往该依赖的请求就被立即拒绝，而不是排队等待，从而加速失败判定。
监控：Hystrix可以近乎实时地监控运行指标和配置的变化，例如成功、失败、超时、以及被拒绝的请求等。
回退机制：当请求失败、超时、被拒绝或当断路器打开时,执行回退逻辑。回退逻辑由开发人员自行提供，例如返回一个缺省值。
自我修复：断路器打开一段时间后，会自动进入“半开”状态。

五、基于Feign调用熔断配置

RestTemplate和feign都支持调用熔断配置，这里只讲基于Feign调用熔断配置。和上篇讲到的一样

（1）引入依赖(feign中已经集成了Hystrix)

（2）在feign配置开启Hystrix

 #开启对hystrix的支持
  hystrix:
    enabled: true

（3）自定义一个接口实现类，这个实现类就是熔断触发的降级逻辑

@Component
public class ProductFeignClientCallBack implements ProductFeignClient {

	/**
	 * 熔断降级的方法
	 */
	public Product findById(Long id) {
		Product product = new Product();
		product.setProductName("feign调用触发熔断降级方法");
		return product;
	}
}

（4）修改feignClient接口，添加降级方法的支持

/**
 * 声明需要调用的微服务名称
 *  @FeignClient
 *      * name : 服务提供者的名称
 *      * fallback : 配置熔断发生降级方法
 *                  实现类
 */
@FeignClient(name="service-product",fallback = ProductFeignClientCallBack.class)
public interface ProductFeignClient {

	/**
	 * 配置需要调用的微服务接口
	 */
	@RequestMapping(value="/product/{id}",method = RequestMethod.GET)
	public Product findById(@PathVariable("id") Long id);
}

现在我们用order_service(商品服务)调用product_service(商品服务)，商品服务不启动。可以看到触发了熔断降级方法

Hystrix的超时时间：

hystrix:
  command:
    default:
      execution:
        isolation:
          thread:
            timeoutInMilliseconds: 3000 #默认的连接超时时间1秒,若1秒没有返回数据,自动的触发降级逻辑

六、服务熔断Hystrix高级

6.1 Hystrix的监控平台

我们知道，当请求失败，被拒绝，超时的时候，都会进入到降级方法中。但进入降级方法并不意味着断路器已经被打开。那么如何才能了解断路器中的状态呢？

除了实现容错功能，Hystrix还提供了近乎实时的监控，HystrixCommand和HystrixObservableCommand在执行时，会生成执行结果和运行指标。比如每秒的请求数量，成功数量等。这些状态会暴露在Actuator提供的/health端点中。只需为项目添加spring-boot-actuator 依赖，重启项目，访问http://localhost:9001/actuator/hystrix.stream ,即可看到实时的监控数据。

6.1.1 搭建Hystrix DashBoard监控

刚刚讨论了Hystrix的监控，但访问/hystrix.stream接口获取的都是已文字形式展示的信息。很难通过文字直观的展示系统的运行状态，所以Hystrix官方还提供了基于图形化的DashBoard（仪表板）监控平台。Hystrix仪表板可以显示每个断路器（被@HystrixCommand注解的方法）的状态。

(1)在order_service_fegin(fegin集成了Hystrix)中.yml配置暴露所有端点

feign:
  client:
    config:
      service-product:  #需要调用的服务名称
        loggerLevel: FULL
  #开启对hystrix的支持
  hystrix:
    enabled: true
#暴露所有端点
management:
  endpoints:
    web:
      exposure:
        include: '*'

(2)引入依赖

<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>

(3)激活仪表盘项目

@SpringBootApplication
@EntityScan("cn.itcast.order.entity")
//激活Feign
@EnableFeignClients
//激活hystrix
@EnableCircuitBreaker
//激活hytrix的web监控平台
@EnableHystrixDashboard
public class FeignOrderApplication {
	public static void main(String[] args) {
		SpringApplication.run(FeignOrderApplication.class,args);
	}
}

(4)访问测试

6.1.2断路器聚合监控Turbine

在微服务架构体系中，每个服务都需要配置Hystrix DashBoard监控。如果每次只能查看单个实例的监控数据，就需要不断切换监控地址，这显然很不方便。要想看这个系统的Hystrix Dashboard数据就需要用到Hystrix Turbine。Turbine是一个聚合Hystrix 监控数据的工具，他可以将所有相关微服务的Hystrix 监控数据聚合到一起，方便使用。引入Turbine后，整个监控系统架构如下：

(1)创建新的子模块：

(2)引入坐标

<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-turbine</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>

(3)配置多个微服务的hystrix监控

server:
  port: 8031
spring:
  application:
    name: hystrix-turbine
eureka:
  client:
    service-url:
      defaultZone: http://localhost:9000/eureka/
  instance:
    prefer-ip-address: true
turbine:
  # 要监控的微服务列表，多个用,分隔
  appConfig: service-order
  clusterNameExpression: "'default'"

eureka相关配置：指定注册中心地址。 turbine相关配置：指定需要监控的微服务列表。turbine会自动的从注册中心中获取需要监控的微服务，并聚合所有微服务中的/hystrix.stream 数据

(4)配置启动类

@SpringBootApplication
//trubin配置
@EnableTurbine
@EnableHystrixDashboard
public class TurbinAppliation {

	public static void main(String[] args) {
		SpringApplication.run(TurbinAppliation.class,args);
	}
}

(5)测试

6.2 熔断器的状态
熔断器有三个状态 CLOSED 、OPEN 、HALF_OPEN 熔断器默认关闭状态，当触发熔断后状态变更为OPEN ,在等待到指定的时间，Hystrix会放请求检测服务是否开启，这期间熔断器会变为HALF_OPEN 半开启状态，熔断探测服务可用则继续变更为 CLOSED 关闭熔断器。

Closed：关闭状态（断路器关闭），所有请求都正常访问。代理类维护了最近调用失败的次数，如果某次调用失败，则使失败次数加1。如果最近失败次数超过了在给定时间内允许失败的阈值，则代理类切换到断开(Open)状态。此时代理开启了一个超时时钟，当该时钟超过了该时间，则切换到半断开（Half-Open）状态。该超时时间的设定是给了系统一次机会来修正导致调用失败的错误。
Open：打开状态（断路器打开），所有请求都会被降级。Hystix会对请求情况计数，当一定时间内失败请求百分比达到阈值，则触发熔断，断路器会完全关闭。默认失败比例的阈值是50%，请求次数最少不低于20次。
Half Open：半开状态，open状态不是永久的，打开后会进入休眠时间（默认是5S）。随后断路器会自动进入半开状态。此时会释放1次请求通过，若这个请求是健康的，则会关闭断路器，否则继续保持打开，再次进行5秒休眠计时。