Gartner报告:可观测性平台魔力象限

可观测性平台魔力象限解析

Gartner报告:可观测性平台魔力象限

作者:Gregg Siegfried, Matt Crossley, 以及其他3位作者

可观测性平台正在从根本上改变组织管理系统健康的方式,其驱动力来自于分析、成本优化方面的创新以及AI观察性(AI Observability)的出现。基础设施与运营(I&O)负责人可以利用这项研究来评估和应对不断发展的供应商及解决方案格局。

01.市场定义

Gartner将可观测性平台定义为用于理解应用程序、服务和基础设施的健康状况、性能和行为的产品。它们通过从各种来源摄取遥测数据(运营数据)来实现这一点,包括但不限于日志、指标、事件和追踪。可观测性平台支持通过人工操作员或机器智能对摄取的遥测数据进行分析,以确定影响最终用户体验的系统行为变化,例如中断或性能下降。这使得能够早期甚至先发制人地进行问题补救。可观测性平台被IT运维、站点可靠性工程师(SRE)、云和平台团队、应用程序开发人员和产品负责人使用。

现代企业严重依赖关键的数字应用程序和服务,这些应用和服务能够产生收入、面向客户并且对业务的高效运营至关重要。中断、性能下降和不可靠性直接影响收入、客户情绪和品牌认知。组织使用可观测性平台来理解和提高这些关键应用程序和服务的可用性、性能和弹性。对可观测性平台的投资和成功部署可以避免收入损失,并实现更快的产品开发周期和品牌认知的改善。

可观测性平台解决的示例用例场景或业务问题包括:

  • IT运维: 负责实时生产环境的 IT 运维团队的任务是确保应用程序和服务始终可用、响应迅速且性能高,尤其是在高需求时期。可观测性平台允许这些团队在检测到问题时收到警报,并可以查询数据以确定根本原因。
  • 平台工程: 平台工程师对可观测性平台的使用类似于IT运维和软件开发。可观测性平台帮助这些团队确保持续满足生产环境的服务级别目标(SLO),并支持数据驱动的持续改进和平台演进。
  • 软件开发: 开发团队将可观测性平台作为CI/CD管道的一个集成部分,提供关于代码部署的快速反馈。这使得能够更快地交付新功能,并提高产品弹性。
  • 业务分析师: 业务分析师可能使用可观测性平台来理解和分析关键业务指标。这些指标通常针对特定组织和客户(例如,零售商衡量废弃购物车的成本和客户平均支出)。

02.必备功能

  • 数据采集与汇聚:统一摄取、存储与分析各类运营遥测数据流,包括但不限于指标、事件、日志和追踪数据。从主流公有云提供商(如AWS、Microsoft Azure、Oracle Cloud Infrastructure等)收集遥测数据。
  • 数据关联与丰富:通过提供上下文信息(例如拓扑依赖关系或服务映射)来丰富原始的遥测数据。支持对受监控服务及其在业务事务中的角色之间的关系进行建模或可视化映射。
  • 问题识别与诊断:识别与分析应用程序、服务和基础设施行为的变更,从而确定中断和性能下降的根本原因。量化这些异常行为对最终用户体验产生的实际影响。
  • 探索分析与洞察:支持对多种遥测数据类型(包括追踪、指标和日志)进行交互式探索与分析,以深入挖掘并生成关于用户和应用程序行为的洞察。

03.常见功能

  • 数字体验监控(DEM):支持通过浏览器、移动应用和API等多种方式交付应用程序和服务。
  • 集成能力:可与各类运营、服务管理和软件开发技术集成,例如IT服务管理(ITSM)、配置管理数据库(CMDB)、事件和事件响应管理、编排和自动化以及DevOps工具。
  • 智能分析与洞察:运用高级分析与机器学习技术,揭示通过手动查询难以或无法得出的深层洞察。
  • 自动发现与映射:自动发现并可视化相关的基础设施、网络、应用程序组件及服务间的依赖关系。
  • 成本管理:衡量和优化应用程序工作负载成本,管理及优化可观测性平台利用率或支出。
  • 业务流程与用户旅程监控:追踪反映用户旅程的关键业务流程(如从登录到结账)。提供漏斗分析以跟踪转化率,并监控如客户入职、贷款申请等关键活动。
  • AI可观测性:提供针对大型语言模型及相关生成式AI工作负载的性能、成本、容量和合规性分析能力。
  • 自动化与补救:支持启动对应用程序和基础设施代码及配置的更改,以优化工作负载成本、容量或性能,或采取纠正措施来补救故障或性能下降。
  • 应用程序安全:例如识别受监控应用程序中的已知漏洞以及阻止利用这些漏洞的尝试的能力。

04.魔力象限图

在这里插入图片描述
图1:可观测性平台魔力象限


05.供应商优势与注意事项

5.1 Amazon Web Services

Amazon Web Services (AWS) 在此魔力象限中属于挑战者。其观察性解决方案以 Amazon CloudWatch 为核心,这是一套用于指标、日志、事件和其他遥测数据类型的工具。其他AWS组件包括用于分布式追踪的AWS X-Ray、用于日志分析的Amazon OpenSearch Service、Amazon Managed Service for Prometheus和Amazon Managed Grafana。这套服务是AWS云运营(AWS Cloud Operations)的一部分,其中还包括治理和财务管理。AWS的客户和运营分布在全球各地。其客户包括各种规模的组织。AWS定期发布和宣布产品更新。

优势

  • AI创新: Amazon 宣布了 Amazon CloudWatch 调查功能,以帮助SRE、IT运维和云工程团队快速诊断、排查和修复运营问题。此外,AWS为Amazon CloudWatch、AWS CloudTrail、Amazon OpenSearch Service和AWS Config推出了自然语言查询生成功能,这将使更广泛的受众能够查询和分析性能问题。
  • 客户体验: AWS提供了市场上最全面的客户支持体验之一,为各种规模的客户提供强大的定制化 onboarding 支持、全球24/7支持、活跃的社区论坛和行业领先的认证计划。
  • 生态系统: AWS观察性工具(如CloudWatch)的原生集成提供了与AWS服务的无缝遥测数据收集,且设置最少。这使得可以通过通用用户界面(UI)进行简单配置,通过AWS控制台进行统一管理和计费,并通过IAM实现一致的安全性。

注意事项

  • 多云工作负载: Amazon CloudWatch 是为与AWS服务集成而设计和优化的。AWS确实提供了有限的预构建集成用于从Microsoft Azure摄取指标,其他数据源将需要使用OpenTelemetry (OTel) 代理、CloudWatch代理或自定义配置。用户还需要仔细评估费用,例如从其他环境流出指标的出口费用,以及摄入AWS的摄取成本。
  • 营销策略: 与此魔力象限中的许多供应商不同,观察性并非AWS的主导产品。因此,AWS专门针对观察性的营销力度落后于本研究报告中的领导者。
  • 成本: 客户反馈,无论是在问询中还是在Peer Insights上,都经常提到与Amazon CloudWatch和其他工具相关的高成本。虽然成本挑战是观察性领域的常见问题,但AWS的集成性质——服务可以轻松地将指标和日志推送到CloudWatch——增加了意外支出的可能性。客户应确保他们正在使用适当的管理工具,例如AWS Cost Explorer和AWS Budgets,并探索日志摄取频率和追踪的设置以减少摄取成本。

5.2 Apica

Apica 在此魔力象限中属于远见者(Visionary)。Apica Ascent 是其可观测性平台,并在其全面的数据管理组合中包含遥测管道能力。其业务运营主要集中在美国和EMEA地区,客户主要集中在北美。Apica成立于2005年,最初专注于综合监控,并以其支持合成工作流中多因素认证(MFA)等能力而闻名。该公司通过2023年收购LogIQ和2024年收购Circonus转向观察性领域,并正在将其综合监控能力迁移到Ascent平台中。

优势

  • 易于采用: Apica Ascent 不分发或要求自定义代理来接入数据。相反,客户可以使用多种采集技术中的任何一种或全部,包括OpenTelemetry collector、Fluent Bit、Logstash,甚至Datadog代理。Flow(Ascent遥测管道解决方案)提供了额外的选项来塑造和摄取传入的遥测数据。
  • 代理舰队管理: 除了数据源灵活性之外,Apica的代理管理子系统(称为Fleet)支持自动化这些遥测收集器的安装和配置。基于行业标准OpAMP协议,Fleet是同类最佳的,即使不使用Ascent的观察性能力,也值得评估。
  • 自带存储(BYOS): Apica Ascent允许其SaaS产品的客户提供自己的对象存储来存储数据。这使Ascent用户能够完全控制其数据的位置,可以简化合规性并支持数据主权要求。

注意事项

  • 产品完整性: 尽管能够支持高级用例(如AI观察性),但Apica Ascent仍在发展之中,并且缺乏一些功能,例如对服务级别目标(SLO)管理和真实用户监控(RUM)的原生支持。
  • 有限 mind share(市场认知度): Apica作为一家公司已有20年历史,但作为可观测性平台提供商并不为人熟知,并且在Gartner客户中还不是常见的选择。
  • 相对规模: 与本研究中包括的大多数其他公司相比,Apica的规模明显较小。在一个竞争激烈的市场中,这种相对规模差异值得注意。

5.3 BMC Helix

BMC Helix 在此魔力象限中属于特定领域者(Niche Player)。BMC Helix Observability & AIOps套件提供了一系列IT运维和观察性能力,由多个产品组成,包括BMC Helix Discovery和其他组件。BMC Helix在相邻的IT服务管理市场拥有重要地位,拥有其BMC Helix ITSM(前身为Remedy)产品。BMC Helix的业务运营在地理上多元化,拥有全球足迹,并支持各种规模和行业的客户。2024年10月,BMC宣布创建两家独立公司,将其自身拆分为两个独立的运营组织;一家保留BMC名称,另一家现称为BMC Helix。就可观测性平台市场而言,本研

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值