
稳定性
飞向札幌的班机
十五年+程序员,喜欢搞开源,欢迎一起交流学习
展开
-
稳定性全系列(四)——如何建设有效预案
1、背景我在对业务系统进行设计和实现时,始终秉承一个原则,那就是“除了自己的系统,其它调用方(上游)和依赖方(下游)都是不可靠的”,这就好比商场如战场,除了自己,其他人都不可信(防人之心不可无)。既然只有自己是可靠的(可信的),那么多外界不可控因素,我们如何在突发情况发生时,采取最有效的行动,将影响控制在合理区间内,这就是我们“紧急预案”需要做的事情,那么如何建设“有效”预案,则是本文重点讨论的话题。2、预案的组成元素不知道大伙是否有看过阿图·葛文德写的《清单革命》,书中“揭露”了一个惊人...原创 2020-10-29 16:10:47 · 3550 阅读 · 4 评论 -
稳定性全系列(三)——放火&降级演练
目录1、背景2、混沌工程3、放火&降级演练3.1、变被动为主动3.2、前提条件3.3、方案实施1. 选择一个放火事件2. 确定燃烧半径3. 制定预案4. 确定计划5. 开始放火6. 记录和分析结果4、总结1、背景系统稳定性建设一直是研发、测试、运维团队绕不开的话题,这么多年来,我们为降低系统复杂度、提升系统可维护性绞尽脑汁,微服务...原创 2020-03-10 00:05:54 · 3549 阅读 · 0 评论 -
稳定性全系列(二)——如何做线上全链路压测
一、背景介绍如今,在微服务架构盛行的互联网时代,微服务架构下模块(本文指可独立部署的服务)之间的关系错综复杂(哪怕是避免模块之间的直接循环依赖都很变得困难),评估一整套业务系统(集群)的容量已经不像评估单机系统那样容易,而系统的容量评估,是稳定性建设的核心内容之一,是我们绕不开的主题。有了系统容量评估,配合今年的业务目标,我们才知道应该申请多少预算、什么时候需要扩容、系统瓶颈在哪、哪些服务...原创 2020-02-23 16:15:00 · 3833 阅读 · 0 评论 -
稳定性全系列(一)——如何做好系统稳定性建设
目录一、背景介绍二、故障源的分类三、稳定性建设四要素第一要素:人第二要素:工具第三要素:预案第四要素:目标四、稳定性建设四个方向第一个方向:根基要抓牢(45%)第二个方向:工作在日常(30%)第三个方向:预案是关键(15%)第四个方向:容量是核心(10%)五、总结一、背景介绍在移动互联网时代,用户群的积累比之前更容易,但同样,也会因为糟糕...原创 2019-12-24 00:49:37 · 16435 阅读 · 9 评论