DevOps 中的可观测性 vs 监控

本文探讨了DevOps中监控与可观测性的核心价值,揭示了两者在SDLC中防止停机时间的重要性,强调了实时监控、问题检测、故障排除和性能改进的作用。同时,介绍了可观测性如何超越监控,提供深层次的见解以预防和解决技术问题。观测云平台作为实例,展示了实现系统可观测性在现代云计算环境中的实践应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如果您从 DevOps 的定义中去除流行语和 TLA ,您会发现所涉及的角色和任务主要是为了在 SDLC(软件开发生命周期)中获得更多的正常运行时间和更少的停机时间。实现这一目标的第一步是在监控解决方案的帮助下发现停机时间。只有这样,您才能及时响应并解决问题,从而最大限度地减少软件开发团队可怕且代价高昂的停机时间。

停机成本高

确保正常运行时间的重要性不容小觑。这是因为 DevOps 团队在解决关键事件时反应迟缓,成本很高——非常高。

北美每张票的平均成本为 15.56 美元。随着票价的增加,这一成本也会增加,L3 票价约为 80-100 美元甚至更多。在 ITIC 进行的一项调查中,33% 的受访者指出,停机一小时的成本可能高达 100 万美元,有时甚至高达 500 万美元。

数据中心中断也是代价高昂的。数据恢复过程中的每一分钟费用可能从 137 美元到 427 美元不等。基础设施故障的平均每小时成本估计为 10 万美元,关键应用程序故障的平均成本在每小时 50 万美元到 100 万美元之间。

很明显,当时间成本非常高昂时,你需要以闪电般的速度做出反应。这意味着您需要实时或接近实时地了解任何中断或停机时间。这就是监控和可观测性发挥作用的地方。

让我们来看看它们之间的区别,以及为什么每个 DevOps 团队都需要事件管理和解决方案。

DevOps 中的监控是什么?

监控系统使 DevOps 工程师能够使用一组预定义的指标和日志来查看和了解系统的状态。通过监控系统中各种组件的行为,DevOps 工程师可以在故障发生时第一时间到现场检测故障。

此外,监控在实现长期趋势分析、仪表板设计和警报 方面发挥着至关重要的作用。

DevOps 中的监控支持三个主要的事件管理目标:

  • 对中断、服务降级、错误和未经授权的活动等事件进行问题检测;在出现此类问题时发出警报并通过仪表板显示相关数据。

  • 通过回答“ what ”和“ where ”的问题,并提供支持故障排除和根本原因分析的信息来解决问题。

  • 通过提供支持增强容量和财务规划、趋势、性能工程和报告的见解,持续改进软件交付流程。

最终,DevOps CI-CD 管道中的监控推动了支持自动问题检测和警报、必要时手动调试以及整体系统健康分析所需的数据的收集——每一项对于加速事件解决都至关重要。

DevOps 中的可观测性是什么?

如果监控是 DevOps 事件解决方案中的一棵树,那么可观测性就是森林。也就是说,如果监控让您知道何时何地出了问题,那么可观测性通过回答“为什么出了问题?可以帮助您看到更大的图景(即森林中的树木)。

具有可观测性意味着能够从监控工具日志中提取可操作的见解。借助这些洞察,您可以更全面地了解系统、应用程序和基础架构的运行状况和性能。

可观测性的主要组成部分是:

  • 记录事件以记录事件,以便团队可以从以前的事件中学习,以加快查找错误的根源和原因。这在调试中起着至关重要的作用。

  • 追踪,被一些人认为是可观测性最重要的部分,因为它可以理解问题的因果关系。跟踪通常通过瀑布图可视化,使开发人员能够了解系统、队列、网络跃点和服务器所花费的时间。最终,它使可观测系统更有效并推动根本原因识别。

  • 指标是收集的定量数据,使开发人员能够发现几天、几周和几个月内出现的趋势。

可观测性的主要好处之一是将大量数据转化为任何人都可操作和可访问的洞察力的过程。如果没有适当的工具,您会发现自己监控的设备越来越多,并且每秒创建的日志数量越来越多。在这种情况下,数据可能更多的是祸根而不是好处。

采用可观测性提供了获取有关如何解决异常的知识。收集和分析的数据越多,利用这些数据加速事件解决的可能性就越大。它甚至可能有助于在问题出现之前先发制人。 

可观测性与监控:有什么区别?

监控是可观测性的一个子集。只有可观测的系统才能被监控。监控工具可跟踪应用程序的整体运行状况,汇总有关其运行情况的数据,并在出现问题时提醒您正在发生的事情和发生的位置。

另一方面,可观测性不是你要做的事情。相反,可观测性是你所拥有的。与监控相反,可观测性是主动的,利用监控日志以及机器学习和因果关系来提供可见性和理解,不仅可以了解正在发生的事情和地点,还可以了解为什么以及如何解决它。

此外,重要的是要注意“可观测性”不仅仅是监控的一个花哨的词。整体大于监控(和其他)部分的总和。

知道出现问题很重要——这就是我们要监控的内容。但是,归根结底,在当今的软件开发世界中,知道什么时候出了问题是不够的。

DevOps 团队需要的是洞察力——更好、更广泛、更准确。只有可观测性才有可能的那种。

通过了解监控和可观测性之间的差异以及各自的目标,可以利用两者之间的共生关系来加速解决事件。

观测云——快速实现系统可观测

当前,云计算市场对系统的可观测性需求庞大,但真正具备可观测性的统一实时监测产品却寥寥无几。作为国内首批一体化系统可观测平台——观测云,能快速实现系统可观测,统一满足您云、云原生、应用及业务上的监测需求。

观测云是新一代一体化数据平台,与传统方案完全不同。支持全场景监测,全面数据驱动,用数字化手段全力保障项目团队方案,保障系统可靠性、稳定性。现在前往观测云官网,注册一个账号,可以免费体验观测云,快速实现系统可观测~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值