Amazon CloudWatch 的新功能
关键字: [Amazon Web Services re:Invent 2024, 亚马逊云科技, CloudWatch Unified Navigation, Amazon Cloudwatch Observability, Unified Navigation Experience, Opensearch Integration, Span Analytics Capabilities, Amazon Devops Assistant]
导读
无论您是在云端运营还是正在迁移您的业务,亚马逊云科技可观察性都能帮助您了解应用程序和基础设施的健康状况。参加本次会议,了解最新的创新技术,这些技术可以帮助您更快地诊断运营问题,并优化工作负载和应用程序的性能、可用性和安全性。这包括Amazon CloudWatch的新功能,如为可观察性数据添加上下文以加速故障排除,以及Amazon Q Developer中新的运营调查功能。深入探讨最新发布的产品,并了解Amazon CloudWatch的最新进展。
演讲精华
以下是小编为您整理的本次演讲的精华。
在不断演进的云计算领域中,亚马逊云科技继续推动创新的边界,在备受期待的亚马逊云科技 re:Invent 2024活动上展示了具有突破性的进展。其中最值得关注的是,Amazon CloudWatch(亚马逊云监控服务)推出了尖端功能,这是亚马逊云科技强大的监控和可观测性服务。本全面叙述深入探讨了这些增强功能的细节,阐明了它们变革性的潜力,以及对开发人员和DevOps专业人员的深远影响。
可观测性是现代应用程序开发的核心概念,包括三个关键阶段:检测、调查和补救。传统上,这一范式建立在三大支柱之上:指标用于测量性能特征和系统组件、日志用于深入了解单个事件流、跟踪用于理解不同组件之间的复杂关系。在亚马逊云科技,提供了广泛的选项来实现可观测性用例,从Amazon CloudWatch产品(如仪表板、警报、指标、日志和通过X-Ray的跟踪)到开源可观测性堆栈(如Amazon Managed Grafana、Amazon Managed Service for Prometheus和Amazon OpenSearch Service)。
在不断演进的云计算领域,开发人员和DevOps专业人员面临的最紧迫挑战之一是确保系统正常运行、为终端客户提供服务并按预期运行。监控覆盖范围是可观测性的关键方面,已成为当务之急,因为“你无法监控你无法测量的东西”这一格言非常贴切。在当今复杂的生态系统中,应用程序运行在各种堆栈、语言、数据库和计算平台上,监控和理解系统中每个组件的行为至关重要。
为直接解决这一挑战,亚马逊云科技推出了CloudWatch Database Insights,这是一项革命性功能,为Amazon Aurora数据库提供了精心设计的见解,并在CloudWatch中提供了跨所有数据库集群的统一视图。这种无缝集成允许开发人员和DevOps专业人员将SQL指标与生成这些查询的应用程序关联起来,从而以前所未有的轻松程度识别性能下降及其根本原因。借助预构建的仪表板和完全托管的无代理体验,开始使用CloudWatch Database Insights非常简单,无需复杂的配置。
另一个常见挑战是难以关联多个组件(如EC2实例、负载均衡器、数据库和缓存)之间的数据。在调查问题时,在指标、日志、跟踪和相关资源之间切换往往是一项艰巨而耗时的任务,使得整个过程复杂且效率低下。例如,Mike Minhi(亚马逊云科技高级首席软件工程师)回忆了一次亲身经历,他不小心破坏了Amazon.com上任何使用Safari浏览器的人的结账按钮,导致了一次难忘的当值事件,需要迅速回滚到上一个已知的良好版本。
CloudWatch Unified Navigation应运而生,这是一种无缝且精简的解决方案,允许开发人员和DevOps专业人员以前所未有的轻松方式在相关遥测数据和资源之间导航。借助自动关系揭示功能,用户可以探索相关资源的内置关键遥测视图,如EC2 CPU指标、数据库指标等,所有这些都是内联的,无需任何配置。这项突破性功能消除了手动在多个控制台之间导航的需求,简化了调查过程,实现了更快的根本原因分析。作为其强大功能的证明,CloudWatch目前每小时在全球范围内映射近万亿个指标、日志和资源之间的关联。
数据孤岛和碎片化长期困扰着可观测性,应用程序数据分散在多个数据存储中,难以获得统一视图。亚马逊云科技通过在CloudWatch Logs之上启用OpenSearch,解决了这一痛点,提供了增强的查询功能,如管道处理语言和SQL,直接来自CloudWatch Logs控制台。这种集成允许开发人员和DevOps专业人员分析他们的CloudWatch Logs和OpenSearch日志,无需复制数据,消除了复杂的ETL管道的需求,促进了更加协同和高效的可观测性体验。
随着分布式系统变得越来越复杂,了解哪些跨度或组件可能导致问题成为一项关键任务。CloudWatch Span Analytics提供了对任何规模的应用程序事务的完全可见性,允许开发人员和DevOps专业人员将跨度作为结构化日志引入,无需采样。借助交互式可视化编辑器,用户可以切分和切块跨度,利用OpenSearch和CloudWatch Logs的分析能力,对这些数据运行PPL和SQL命令,实现模式识别、异常检测,并与Amazon X-Ray无缝集成。
当值班时可能会感到压力重重,尤其是在半夜被叫醒时,缺乏上下文信息,且可能影响客户。在这种情况下,拥有一位值得信赖的向导是非常宝贵的。亚马逊云科技推出了Amazon Q Developer Ops Assistant,这是一款AI驱动的助手,可调查和修复运营问题,提供假设和观察结果,帮助进行根本原因分析。Amazon Q Developer Ops Assistant可以从警报自动启动,在开发人员和DevOps专业人员醒来时提供预先准备好的建议,让他们进一步完善指导过程。这些调查提供了一个协作空间,可以共享信息并与票证系统、运行手册和聊天系统集成,完美融入事件响应工作流程。
为了展示这些新功能的强大功能,Mike Minhi在舞台上进行了生动的演示。他演示了一个场景,其中由于负载均衡器服务器错误而触发警报,HTTP 500错误计数从100%可用性的基线飙升。只需几次点击,Mike就可以从负载均衡器导航到目标组、EC2实例,甚至连接的EBS卷,立即获得每个组件的健康指标的可见性。直观的拓扑映射和上下文菜单使探索相关资源和日志变得非常简单,最终他发现了一个高CPU实例存在内存不足错误 - 这可能是根本原因。Mike强调,如果没有CloudWatch Unified Navigation,在亚马逊云科技解决类似事件需要花费大量时间,从而延长了客户影响。
在另一个引人入胜的演示中,Mike介绍了Amazon Q Developer Ops Assistant,展示了它如何与CloudWatch Investigations无缝集成。他演示了一个示例调查,其中API可用性图从100%下降到约95%,触发了当值调查。Amazon Q自动分析提供的数据,建议相关指标、日志,甚至提出根本原因的假设。随着调查的进行,Amazon Q继续提供观察结果和建议,例如一个图表显示DynamoDB限制与API可用性下降时间一致的峰值,并提出了DynamoDB表配置错误的假设。Amazon Q甚至建议采取行动,比如扩展DynamoDB表,只需单击一下即可执行。Mike强调,Amazon Q Developer Ops Assistant可以从警报自动启动,在开发人员和DevOps专业人员醒来时提供预先准备好的建议,让他们进一步完善指导过程。
Mike还演示了CloudWatch Unified Navigation如何与其他亚马逊云科技服务(如EC2)无缝集成。在一个示例中,他从EC2控制台导航到名为“PetShop”的应用程序的健康指标,其中包括多个数据库。通过利用“查找资源”功能并按标签过滤,Mike可以快速访问与PetShop应用程序相关联的RDS数据库实例的健康状况,而无需离开EC2控制台。这展示了CloudWatch Unified Navigation在亚马逊云科技控制台中的无处不在,使开发人员和DevOps专业人员能够访问其账户中任何可监控资源的监控数据。
会议最后强调了几个关键要点,包括监控覆盖范围的重要性、使用CloudWatch Unified Navigation关联遥测数据的简易性,以及Amazon Q Developer Ops Assistant在关键事件期间提供的宝贵帮助,确保开发人员和DevOps专业人员永远不会孤军作战。
在不断演进的云计算世界中,复杂性和规模是常态,亚马逊云科技在亚马逊云科技 re:Invent 2024上推出的Amazon CloudWatch新功能代表了可观测性和事件响应领域的一大飞跃。借助CloudWatch Database Insights、Unified Navigation、OpenSearch集成、Span Analytics和Amazon Q Developer Ops Assistant,亚马逊云科技使开发人员和DevOps专业人员能够以前所未有的效率和精度监控、调查和修复问题。
拥抱这些尖端功能,开启可观测性的新时代,在这个时代里,每个组件都是可见的,每个关联都是无缝的,每次调查都是通向解决方案的协作之旅。加入重新定义云计算边界的行列,体验亚马逊云科技最新创新的变革力量。
下面是一些演讲现场的精彩瞬间:
Unify Navigation 允许您轻松识别并放大具有高 CPU 使用率的可疑 EC2 实例,并显示其关联的资源和日志。
亚马逊云科技 CloudWatch Logs Insights 识别出一种新的“内存不足”错误模式,表明某个 EC2 实例可能存在问题,因为它收到了一个异常请求而触发了潜在的错误。
通过统一的拓扑图,可以无缝导航跨越 亚马逊云科技 服务,从而探索相关资源而无需离开当前控制台。
使用 EC2 控制台中的“查找资源”功能和资源标记,可以无缝导航和监控各种 亚马逊云科技 资源,包括 RDS 数据库。
演讲者演示了 CloudWatch 控制面板如何与“探索相关”功能无缝集成,在单个控制面板中提供负载均衡器、数据库和 API 的所有健康指标的全面视图。
Amazon Q Developer OpsAssistant 被引入作为一种强大的工具,可以协助开发人员进行调查和解决问题,成为他们编码之旅中的宝贵伙伴。
总结
在这个引人入胜的叙事中,我们踏上了一段通往可观测性领域的旅程,亚马逊 CloudWatch 在这里展现了最新的创新,为开发人员和 DevOps 专业人士赋能。故事从可观测性的本质入手,包括检测、调查和补救阶段,由指标、日志和跟踪这三大支柱支撑。
第一个关键点围绕着监控覆盖范围的重要性,因为现代应用程序环境包含了多种多样的组件、语言和平台。亚马逊 CloudWatch Database Insights 成为了一个游戏规则改变者,为 Aurora 数据库提供了量身定制的洞见,无缝地将 SQL 指标与应用程序联系起来,并且无需代理即可轻松监控。
第二个关键创新是 CloudWatch 统一导航,这是一种跨相关资源关联数据的简化解决方案。通过自动关系揭示和内置的遥测视图,开发人员可以通过 Amazon CloudWatch 控制台浏览整个依赖关系树,消除了碎片化,促进了统一的可观测性体验。
第三个变革性功能是 OpenSearch 与 CloudWatch Logs 的集成,实现了增强查询功能和跨两个数据源的统一分析。这种合并消除了复杂的 ETL 管道的需求,使开发人员能够发挥两者的优势。
在一个引人入胜的结尾,叙事介绍了亚马逼 Q Developer Ops 助手,这是一个由人工智能驱动的调查员,可以帮助解决运营问题。凭借提供假设、观察结果和建议行动的能力,亚马逼 Q 成为了值得信赖的伙伴,指导开发人员进行调查,缓解了当值情况下的压力。
故事最后发出了响亮的行动号召:拥抱这些创新,发挥它们的力量,踏上无缝可观测性的旅程,在这里,监控、关联和调查变成了轻而易举的工作,推动您的应用程序达到新的性能和可靠性高度。
亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者。提供200多类广泛而深入的云服务,服务全球245个国家和地区的数百万客户。做为全球生成式AI前行者,亚马逊云科技正在携手广泛的客户和合作伙伴,缔造可见的商业价值 – 汇集全球40余款大模型,亚马逊云科技为10万家全球企业提供AI及机器学习服务,守护3/4中国企业出海。