
SRE
文章平均质量分 72
wangxiaoangg
这个作者很懒,什么都没留下…
展开
-
centos 安装supervisor 详解
执行以下命令二 配置supervisor1.在文件结尾[include]节点处把;改为files = conf.d/*.confa.在/usr/lib/systemd/system/目录下创建文件supervisord.service执行以下命令:d.验证是否为开机启动:#提示 enabled 表示成功。原创 2023-06-29 13:38:45 · 1603 阅读 · 0 评论 -
熔断原理与go代码实现
在一个系统中,一个服务通常会依赖许多其他的服务,并且服务在某些时候失败是不可避免的。如果我们失败的服务变得无响应,所有依赖它的服务也有变得无响应的风险。这就是所谓的 级联故障。原创 2022-10-17 17:41:33 · 758 阅读 · 0 评论 -
应对过载-客户端限流算法
计算公式之前有介绍,当某个请求超过服务端超过资源的配额时,服务端会立即返回一个过载错误,该错误会比真正的业务逻辑 消耗的资源少的多。但是,返回过载错误仍然会消耗一定数量的资源。如果发送过载错误的数量很多,那么消耗的资源仍可能很大。客户端的过载保护可以很好的解决这个问题。翻译 2022-10-16 21:50:31 · 337 阅读 · 0 评论 -
应对过载- go-zero源码阅读
运维一个可靠的系统 一个根本要就是能够优雅的处理过载的情况。CPU资源的不足导致的负载上升是我们工作中最常见的,如果CPU资源不足以应对请求负载,一般来说所有的请求都会变慢,CPU负载过高会造成一系列的副作用,主要包括以下几项:正在处理的(in-flight) 的请求数量上升服务器逐渐将请求队列填满,意味着延迟上升,同时队列会用更多的内存线程卡住,无法处理请求cpu死锁或者请求卡主rpc服务调用超时cpu的缓存效率下降。原创 2022-09-26 22:33:44 · 683 阅读 · 0 评论 -
系统监控的四个黄金指标
Google SRE 定义了四个需要监控的关键指标。延迟(Latency),流量(Traffic),错误(Errors)和饱和度(Saturation)。正如google sre 所讨论的,如果您只能衡量服务的四个指标,请关注这四个指标。延迟 Latency延迟是服务处理传入请求和发送响应所用时间的度量。测量服务延迟有助于及早发现服务的缓慢。流量 Traffic流量可以更好地理解服务需求。通常称为服务 QPS(每秒查询数),流量是服务请求量的度量。此信号可帮助您决定何时需要扩大服翻译 2022-05-08 23:11:53 · 3800 阅读 · 0 评论