不出事故,没有人知道你重要

文章讨论了运维在保持线上环境稳定时的重要性,即使事故罕见,但运维在事故处理中的角色不可忽视。作者质疑为何事故后才强调运维价值,提出稳定性建设应是持续过程而非一阵风。同时,将企业对稳定性的追求比作痛风,强调预防优于事后补救。

767d8e342a5e5867f3ac1d80346416e2.jpeg

有同学在知乎上提问:“线上无事故,运维还重要吗?”,描述如下:

本人运维行业,本部门在近几年一直保持效率增长且极少出现重大saas生产事故,并且为其他部门输出提升方法以及友好协同提升,但是最近从各层面接到反馈说对运维的投入减少,着实想不通,线上出了事故要运维背锅,产品出了bug要运维陪着到最晚,为什么把线上环境搞得稳定了,却不重视运维岗了?

这是原贴:https://www.zhihu.com/question/497361582

以上提问的是一个运维的同学。言下之义是不出事故,没有人知道运维重要。

这位同学的的感受,过去几年,我感同身受。我相信因为这个标题而点进这篇博客的同学,也有同样的感受。

但是,为什么出事故后,是运维重要呢?而不是测试、开发或者手机端开发呢?

通常是因为运维这个角色:

  1. 1. 线上环境,他们最清楚,通常也只有他们有权限操作线上环境,可以紧急加一个数据库索引;

  2. 2. 他们掌握了部署能力,可以发起回滚操作;

  3. 3. 有权限查看各个组件的情况,并诊断根因;

  4. 4. 为团队准备基础设施能力,如金丝雀发布能力;

  5. 5. 搭建告警监控系统、CMDB、DevOps平台等。

  6. 6. 等等

但是,这些与是否出事故,有多大的关联性呢?我们应该统计各种事故的根因的类型的比例,才有答案。

就目前而言,我们并不能说因为我们看重运维,就不出事故。

以上的问题是从个人感受出发的提问。只是更深层次问题的表象。

从企业层面上,我的疑问是:为什么在企业里,稳定性建设通常都是一阵阵的。即出一次事故,就立个项,就加班加点去完成“稳定性”项目。

比起讨论个人感受,从企业层面讨论这个问题,似乎更有趣。

其实,除了稳定性,软件的质量建设也是一阵阵的。想想,不是吗?不出Bug,没有人知道测试重要。

也许这是所有企业的正常表现。就像人的身体,痛风(一种慢性病)不发作时,你是不会感受它的存在,也自然就不会想到要去治疗或者预防它。然而,如果平时不注意饮食和锻炼,痛风经常复发。

线上事故就如同企业的痛风。企业应对“痛风”,容易好了伤疤忘了痛。

虽说可能是所有企业的正常表现,但不是一种健康的表现。

预防痛风,只能通过健康的生活方式如:

  • • 限制或避免饮酒,尤其是啤酒。

  • • 限制或者避免饮用含糖饮料,尤其是含高果糖玉米糖浆的饮料。

  • • 限制肉类摄入量,尤其是红肉、内脏和海鲜。

  • • 保持健康的体重。如果您需要减肥,请避免断食或过快地减肥,因为这可能会暂时增加尿酸水平。

  • • 增加水和低脂乳制品的摄入量。这些有预防痛风的作用。

一个人应对痛风的健康表现应该是采用健康的生活方式。

说回企业的稳定性建设,也是一样的道理。

稳定性不是通过“一阵阵的运动”或者“一阵阵的表演”来建设的,而是通过平时健康的企业活动来实现的(我无意指导别人的企业,这只是我个人的思考)。

当然,现实中,对于有些人,要维持健康的生活方式是一件很难的事情(想想有身边有多少人做到早睡早起),而另一些人是一件很自然的事。为什么呢?

相同的,一家企业为什么无法自然地做到健康的企业活动?一定要出事故,才知道X的重要性呢?(X代表任何东西)

这个问题就很大了。希望对各位读者有启发。

 往期好文推荐:

内容概要:本文介绍了一个基于多传感器融合的定位系统设计方案,采用GPS、里程计和电子罗盘作为定位传感器,利用扩展卡尔曼滤波(EKF)算法对多源传感器数据进行融合处理,最终输出目标的滤波后位置信息,并提供了完整的Matlab代码实现。该方法有效提升了定位精度与稳定性,尤其适用于存在单一传感器误差或信号丢失的复杂环境,如自动驾驶、移动采用GPS、里程计和电子罗盘作为定位传感器,EKF作为多传感器的融合算法,最终输出目标的滤波位置(Matlab代码实现)机器人导航等领域。文中详细阐述了各传感器的数据建模方式、状态转移与观测方程构建,以及EKF算法的具体实现步骤,具有较强的工程实践价值。; 适合人群:具备一定Matlab编程基础,熟悉传感器原理和滤波算法的高校研究生、科研人员及从事自动驾驶、机器人导航等相关领域的工程技术人员。; 使用场景及目标:①学习和掌握多传感器融合的基本理论与实现方法;②应用于移动机器人、无人车、无人机等系统的高精度定位与导航开发;③作为EKF算法在实际工程中应用的教学案例或项目参考; 阅读建议:建议读者结合Matlab代码逐行理解算法实现过程,重点关注状态预测与观测更新模块的设计逻辑,可尝试引入真实传感器数据或仿真噪声环境以验证算法鲁棒性,并进一步拓展至UKF、PF等更高级滤波算法的研究与对比。
内容概要:文章围绕智能汽车新一代传感器的发展趋势,重点阐述了BEV(鸟瞰图视角)端到端感知融合架构如何成为智能驾驶感知系统的新范式。传统后融合与前融合方案因信息丢失或算力需求过高难以满足高阶智驾需求,而基于Transformer的BEV融合方案通过统一坐标系下的多源传感器特征融合,在保证感知精度的同时兼顾算力可行性,显著提升复杂场景下的鲁棒性与系统可靠性。此外,文章指出BEV模型落地面临大算力依赖与高数据成本的挑战,提出“数据采集-模型训练-算法迭代-数据反哺”的高效数据闭环体系,通过自动化标注与长尾数据反馈实现算法持续进化,降低对人工标注的依赖,提升数据利用效率。典型企业案例进一步验证了该路径的技术可行性与经济价值。; 适合人群:从事汽车电子、智能驾驶感知算法研发的工程师,以及关注自动驾驶技术趋势的产品经理和技术管理者;具备一定自动驾驶基础知识,希望深入了解BEV架构与数据闭环机制的专业人士。; 使用场景及目标:①理解BEV+Transformer为何成为当前感知融合的主流技术路线;②掌握数据闭环在BEV模型迭代中的关键作用及其工程实现逻辑;③为智能驾驶系统架构设计、传感器选型与算法优化提供决策参考; 阅读建议:本文侧重技术趋势分析与系统级思考,建议结合实际项目背景阅读,重点关注BEV融合逻辑与数据闭环构建方法,并可延伸研究相关企业在舱泊一体等场景的应用实践。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值