微服务 —— 断路器设计

熔断机制是应对雪崩效应的一种微服务链路保护机制。当链路的某个微服务出错不可用或者响应时间太长时,会进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息。当检测到该节点微服务调用响应正常后,恢复调用链路。服务断路器的设计架构图如下:

微服务 —— 断路器设计

1 断路器状态

服务调用方为每一个调用服务 (调用路径) 维护一个状态机,在这个状态机中有3种状态:

  • CLOSED:默认状态。断路器观察到请求失败比例没有达到阈值,断路器认为被代理服务状态良好

  • OPEN:断路器观察到请求失败比例已经达到阈值,断路器认为被代理服务故障,打开开关,请求不再到达被代理的服务,而是快速失败

  • HALF OPEN:断路器打开后,为了能自动恢复对被代理服务的访问,会切换到半开放状态,去尝试请求被代理服务以查看服务是否已经故障恢复。如果成功,会转成CLOSED状态,否则转到OPEN状态

2 熔断策略

  • 指定时间内失败率超过指定阈值

  • 指定时间内失败次数超过指定阈值

  • 可跟进熔断等级,适当调整熔断超时时间

3 恢复策略

  • 指定时间内失败率低于指定阈值

  • 指定时间内失败次数低于指定阈值

4 拒绝策略

  • 直接抛出指定异常

  • 调用降级策略进行处理

5 常见问题

使用断路器需要考虑一些问题:

  • 针对不同的异常,定义不同的熔断后处理逻辑

  • 设置熔断的时长,超过这个时长后切换到HALF OPEN进行重试

  • 记录请求失败日志,供监控使用

  • 主动重试,比如对于connection timeout造成的熔断,可以用异步线程进行网络检测,比如telenet,检测到网络畅通时切换到HALF OPEN进行重试

  • 补偿接口,断路器可以提供补偿接口让运维人员手工关闭

  • 重试时,可以使用之前失败的请求进行重试,但一定要注意业务上是否允许这样做

6 使用场景

  • 服务故障或者升级时,让客户端快速失败

  • 失败处理逻辑容易定义

  • 响应耗时较长,客户端设置的read timeout会比较长,防止客户端大量重试请求导致的连接、线程资源不能释放

 

更多JAVA、高并发、微服务、架构、解决方案、中间件的总结在:https://github.com/yu120/lemon-guide

 

微服务 —— 断路器设计

上一篇:new 一个对象发生了什么


下一篇:运行时数据区03--方法区