蛰伏两个月,我们的产品团队带着优维EasyOps v7.10来跟大家见面了!
本次版本发布深度整合了优维科技近半年产业实践成果,不仅全面解析EasyOps v7.10核心特性,同时也会更加系统地阐述应用系统管理能力的持续进化与叠加价值。
所以,到底什么是EasyOps v7.10?
我们姑且先笼统地总结为:一颗搭配了自愈式业务链、穿透式观测网以及乐高式配置台的新一代核心系统“运维效能核弹”。
下面是我们对这颗小小运维“核弹”的核心能力的拆解。
标准化采集能力重点聚焦在One Model的演进。
One Model基于优维科技近期项目实践的积累,最近新增了存储网络安全领域的覆盖。One Model的标准建模也是基于众多CMDB项目经验积累演进而来的,它不仅是一个建模工具,更承载了优维积累的专家意见,旨在通过One Model将业务价值传递给广大客户朋友。
那么One Model 是如何覆盖各个新领域?我们的落脚点是什么?如何支撑整个One Model 体系?以上问题主要从三个方面切入:
-
基于标准建模,提供对应的标准采集能力支撑。这是我们基于项目实战积累打磨出的各领域可开箱即用的自动采集套件。
-
数据采集完成后,提供对应的标准视图,可直观呈现资源数据。
-
在各个资源领域,基于上层消费场景的封装,提供对应的业界标准产品能力。
来看看我们具体都做了哪些努力。
首先,我们的采集能力目前可以覆盖全资源域,包括主流云平台(含云采集)、K8S以及硬件设备(如物理服务器、交换机、路由器等)。这些都是基于项目实战打磨沉淀的,并非随意为之。
在资源发现页面,各个资源域都配备了丰富的采集套件可直接一键启用。除了可支持资源实例的发现,自动发现功能也能做到关联关系的识别,我们将项目积累的资源关联关系发现规则内置发布,真正帮助用户实现了开箱即用。
此外,我们的采集直达监控指标,也真正意义上做到了“发现什么资源就提供对应的监控套件”。正如对应的监控采集示意图所示,用户从此无需再逐个编写程序脚本,省时且省力。
采集完成后,数据如何呈现?我们提供了丰富的标准视图供用户直接消费。
首先,CMDB的消费查询视图内置了常用的实例拓扑,用户可直接在拓扑列表或详情页查看。此外,我们也内置了系统全景图。例如在应用系统管理中,可直接查看部署架构及关注的系统资源。监控的分析视图同样基于One Model 构建来实现视图呈现。态势感知视图包括架构视图的呈现,监控告警的根源分析,其视图消费能力,以及针对众多监控资源对象的内置监控dashboard都得到了支持。
在各资源域,我们也提供了对应的标准产品力。
例如在基础设施领域,大家可通过CMDB顶部菜单可直接进入主机、VMware、K8S、数据中心管理、云资源管理等专业视图,而非过去的通用实例管理的平铺而离散的方式。
我们新增了云资源管理功能。在云资源管理中,可以基于云平台和云账号维度进行独立管理与查看。例如查看某云账号下采集到的资源对象及其数量,点进去即可查看每个资源类型的具体实例详情。在应用系统管理中,我们也对云资源提供了全面支持,包括应用系统管理使用的云资源及其云服务等。
除了基础设施领域的支持,EasyOps v7.10在应用系统域有哪些消费和对应的标准能力建设呢?我们将看到产品团队围绕“以应用系统为中心”的资源管理所做的努力。
回顾产品历史的时候,我们经常探讨应用系统管理时,究竟在管什么?应该维护哪些资源信息?
从设计态出发,需基于业务梳理出具体系统,明确其底下由哪些具体应用组件组成,并定义对应的契约。应用系统需部署到不同环境上,每次部署形成一个具体部署单元。该部署单元必须明确运行在哪些具体主机或Pod上。当对外提供服务时,基于IP+端口我们可以捕捉到对应的服务实例,基于IP+部署安装路径我们可以确定对应的部署实例。
在应用系统领域,标准管理流程如下:
-
第一步:梳理业务并纳管设计态信息
需完成业务梳理,准确纳管设计态的应用系统信息。
-
第二步:进行环境规划
需规划系统部署的具体环境数量(例如几套环境),并明确这些环境所使用的基础设施(如主机、K8S集群或云资源)。我们的平台提供对全类型基础设施的覆盖,支持直接管理。
纳管环境后,如何确保数据的实时性和准确性?
我们支持节点自动发现能力,确保数据的自动维护。对于发现的部署实例,应用系统管理提供智能聚类能力将其自动汇聚为应用服务。该能力已全面覆盖主流部署形态(主机、云、K8S或Docker),实现从自动发现到智能分析的完整闭环。
进行节点自动发现时,创建对应的发现任务,会上报该环境下的部署实例。
在节点自动发现过程中,项目上会遇到只需纳管用户关注部分进程的场景。对此,我们提供事前管控——节点白名单能力。通过配置系统的进程特征,例如系统的工作目录、运行用户是可被明确的标识的,这样我们通过节点白名单即可确保只采集当前系统进程信息,上报数据在可控范围内,避免冗余。
当然,应用系统纳管的初期阶段白名单可能会持续调整,在调整的过程中就会可能产生冗余的数据入库。为此,我们也支持事后治理能力——通过智能分析识别冗余数据(如本应被黑白名单拦截的),提供一键清理功能。
接下来看智能聚类能力。
节点信息上报后,智能分析服务进程会根据服务协议进行聚类处理,生成可聚类清单。用户可一键将发现的部署实例智能维护到应用中。对于已有应用的情况,也可关联到现有应用。例如主机部署方式,上报部署信息(端口、进程等);云资源同样能识别并适配,可查看云资源特定的基本信息;K8S也做了对应处理。
我们将为大家展示应用系统管理的标准流程,效果肉眼可见:
-
第一步:业务梳理与纳管
梳理业务,纳管应用系统。
-
第二步:环境规划与维护
规划系统部署环境,明确各环境使用的基础设施(主机、K8S、云资源),并进行维护。
-
第三步:节点自动发现
一键创建节点自动发现任务,自动发现当前环境节点。
-
第四步:节点聚类
对发现的节点进行聚类处理
-
第五步:应用全景查看
聚类完成后,可查看整个应用系统情况。例如主机部署的应用,点击详情即可查看应用基本信息、现网实例使用情况、运行主机基本信息等。
值得一提的是目前K8S/云资源部署兼容性已全面覆盖,此外平台还内置多种架构视图,如图示项目环境中积累的服务调用图。
可根据企业自身业务诉求调整资源全生命周期阶段或阶段内的子项,也可以根据资源展示诉求,自定义资源拓扑层、分类及模型。我们希望能够在客户需求的差异化上提供更多的便利。
诚如前文所提,我们现在对云资源不再是单一资源管理,而是提供云资源账号的立体视图。并支持按可用区、资源池等维度查看资源数据。
在7.10版本中,我们也对应用系统做了许多优化,例如系统实例拓扑、自动发现节点聚类、系统架构图、权限等能力的提升。同时对CMDB菜单、数据中心设备显示规则进行了优化。
HyperInsight(监控)标准化实施建设的内容,我们本次迭代主要聚焦两大特性——告警模板和态势感知。
我们的监控平台内置了丰富的告警配置能力,但实际配置过程仍存在挑战:当前配置高度依赖运维人员个人经验,导致阈值设置不合理、团队内标准不统一、新手配置门槛高等问题,制约运维团队的效率与发展。
为此,我们推出内置的专业告警模板:
-
来源可靠:模板基于真实项目实践沉淀,符合行业标准阈值。
-
开箱即用:在保留专业性的同时,显著降低告警配置复杂度。
告警模板如何使用?
前提步骤:首次升级此能力时需进行初始化告警模板(只需初始化一次)。
-
步骤一:选择目标资源
-
步骤二:
在监控模板表单中按需配置,主要是配置监控目标(针对哪些资源实例告警)和告警通知(通知方式和通知对象)。其余告警配置项(如告警阈值、通知内容模板等)已在模板中封装,无需额外配置。
当然,通过模板配置告警后,用户仍可在告警规则中按需调优。
先简单回顾态势感知概念:以系统为中心,展开该系统下各应用、各资源的全面监控,支撑运维团队日常系统巡检或告警排查。
如何构建这种立体化的系统视图?
我们采用分层卡片(层级展示能力)。页面中,上层展示与该系统相关的业务流(可自定义);中间部分是基于应用系统管理维护的相关应用,按应用架构层级展示;最下层可查看系统相关的基础设施(如内置的主机、K8S集群)或其他系统资源。
为了适配不同用户对系统下资源管理的差异诉求(如使用云资源或需查看物理服务器等硬件),我们在系统态势感知层级中支持自定义层级能力。
在【快速开始】的监控资源编辑页面进行配置。注意维护该资源与系统的关联关系。
【ITSM双轨升级】EasyOps v7.10带来 "体验+" 与 "配置-" 双重惊喜!
本次升级我们以"一升一降"为核心策略,提升用户体验、降低配置复杂度。
-
提升体验:全新工单详情页交互设计,操作流畅度提升40%
-
降复杂度:表单库新增用户、用户组、组织架构控件,配置复杂程度减少60%
在ITSM的表单设计中,用户/用户组/组织架构是常见的高频配置场景,之前基本依赖脚本实现复杂规则或通过实例选择控件实现简单选人,配置相当繁琐复杂,脚本还存在重复编写、调整容易遗漏、流程加载变慢等问题。
将用户/用户组/组织架构的高频场景标准化,解决配置痛点问题,降低配置复杂度,还能基于标准化控件做拓展应用。
-
动态审批人:流程节点支持选择历史表单内用户控件作为动态审批处理人。
-
智能默认值:根据配置自动填充表单默认值,例如当前登录用户及所属部门。
-
多路径选择方式:弹窗式选择器支持用户、用户组、组织架构多种路径选人模式。
-
自定义展示字段:用户可结合实际需要自定义表单选择时展示的信息。
-
选择范围限制:用户可结合实际需要限制表单内对应字段可选范围。
-
移动端完美适配:三大控件在移动端完美适配。
-
更多功能设置:控件支持更多细节配置,比如页面隐藏控件、限制控件选择上限、支持单选/多选等。
-
工单详情页全新改版:
改善工单详情页面排版,各类信息一目了然;完善打印工单功能,增加处理历史等打印信息,支持自定义打印内容。
-
流程编排独立权限:
新增专属“ITSM流程编排“角色,独立控制流程编排权限。
还有更多ITSM升级优化,调整多多等您来探索~
平台基础功能建设在这个版本迎来三大能力提升。
日常运维中有各种搜索需求,例如故障排查时需在工具库找诊断工具或在知识库找解决方案。以往需切换不同产品搜索,链路长,耗费时间精力。
本次升级推出全局搜索快捷入口:
-
单一入口即可完成IP、工具、知识库等多维资源检索;
-
入口常驻系统顶部导航栏,可用快捷键快速唤醒,一键直达搜索结果;
-
开放查询器自定义配置,团队可按需配置查询器(如工单检索、工具搜索等)。
IP搜索是故障排查的高频操作。
本次版本增强了IP搜索能力:
-
输入IP,一个页面全景展示主机关联的所有资源实例(部署实例、应用、系统等),直观高效;
-
扩展IP搜索的模型范围,支持交换机、物理机等设备模型的搜索;
-
可自定义模型和关系,灵活匹配各团队需求。
之前DashBoard放在监控产品线中,用户可自定义仪表盘完成指标分析。
本次将其从监控中抽离,成为平台公用能力。支持按产品线分类管理DashBoard,解决不同产品线资源统计、指标分析和自定义报表需求,同时内置了三个常见的CMDB资源统计报表。
以上就是优维EasyOps v7.10的“运维效能核弹”的拆解报告,它将带给用户全新的产品体验:
-
故障自愈的免疫系统——节点智能聚类、冗余精准治理
-
业务透视的超级透镜——全局搜索秒级定位、IP拓扑穿透关联
-
效能进化的乐高工厂——表单控件拖拽生成、Dashboard自由拼装
将其喻为“核弹”或许带有些虚幻色彩,但回归务实主义,EasyOps v7.10的产品底色一如既往来自于对真实业务场景的深度拆解与标准化沉淀,这个是优维长期不变的产品哲学。
未来,我们将继续以项目实践为养分,让每一次迭代都成为运维效率的“助推器”,与客户共同在智能运维的赛道上持续进化,让技术价值更高效地转化为业务增长动力。
- end -