智能运维:企业数字化转型之路的解决方案

面临的问题及挑战

数据中心发展历程

数据中心的发展历程经历了几个阶段,2000年开始在中国建立,至今已经经历了三个主要阶段。在早期阶段,数据中心的建设主要以项目建设为导向,缺乏规划和专门的运维管理体系。因此,开发建设完成的项目都是独立运维维护,导致效率低下。在中期阶段,各行各业开始进行应用的大集中,逐步建立了生产中心和灾备中心,并引入了“两第三中心”的模式。此外,该阶段开始建立了系统规范的运维体系,如IT服务体系和监控体系等运维框架,并通过流程实现了跨部门的运维协同,明确了开发、测试、运维的边界,推动了专业领域内运维工具的发展。在后期阶段,自2015年以来,随着IT技术的高速发展和业务需求的不断变化,数据中心逐步向多活混合云环境演进,从金融行业扩展到运营商、能源、政府、军工等行业。数据中心开始围绕服务和资源的供给提供运维保障,运维工作逐步走向一体化、自动化,并最终向智能化演进。本篇文章提出的解决方案主要针对自动化运维场景。

数据中心现状分析

因当前大部分数据中心运维环境较为复杂,且 IT 技术栈具有多样性,故而导致运维对象愈发庞大,运维人员每日的运维工作越来越复杂繁琐。经统计,上述复杂的运维工作中的 70% 均是规律且重复性的,因此导致人力投入成本越来越大。此外,因缺乏标准化运维工作流程,所以运维工作质量只能通过技术人员个人主观因素来判定。另一方面,大部分企业运维工作人员沉底下来的知识无法有效复用,交接工作流于形式,因此导致运维工作效果一般。

除上述 70% 的重复性运维工作外,还有 30% 的运维工作是属于复杂且操作风险高的。企业经常会因为技术人员个人因素造成了业务的隐患。整体运维工作效率偏低,带来了业务中断时间长,应急处置效果低的问题。

自动化运维挑战与最佳实践

基于以上数据中心的运维问题,云智慧根据自身在自动化运维的多年经验,总结以往在进行自动化运维项目建设时遇到的挑战。如云智慧很多客户建设了自动化运维平台,但平台本身缺少开箱即用的场景;此外,部分客户项目的建设周期过长,且缺少行业最少实践的参考。

云智慧的 Automation 平台在各行各业都有交付,且将各行各业常用的自动化运维业务场景沉淀成了标准产品组件,真正做到了开箱即用。如海量的巡检指标,应用发布的标准化编排,灾切的最佳实践等,均能大幅缩短自动化平台建设周期情况下,给出最佳实践供企业参考选择。

传统的自动化平台大部分以脚本调度功能为主,缺少了各种无代理协议的远程采控机制。云智慧基于运维中台化的理解,打造了专门的全栈采控中心 cdc,在支撑脚本类的调度功能以及开机即用的功能下,还支持了各种硬件、虚拟化、容器、微服务、业务类等封装好的采控 API 接口。如各类虚拟化的创建、扩缩容接口,硬件 IPMI 的采控协议,K8S 的接口等。 云智慧采用分布式大数据架构和智能化调度引擎解决了高并发处理能力问题,支持百万级管理节点高效率高文档的工作状态。

以往的自动化工具缺少标准化和开箱即用的服务调用接口,现今其他运维工具很多缺少场景联通,容易形成自动化数据孤岛。云智慧依托自身的运维中台,具备开箱即用的标准化服务接口,不管是其他运维工具调用自动化工具,还是自动化工具接入第三方运维工具的数据,均可以满足。

解决方案与功能场景介绍

自动化运维平台架构图

下图为云智慧自动化运维平台的架构图,分为以下几个纬度:

  • 纳管对象层:包含数据中心日常运维的全栈对象,例如操作系统、数据库、中间件、物理服务器、业务应用、网络设备、存储、云以及虚拟化资源等。
  • 执行通道层:针对下图被管理的对象,云智慧采控中心 cdc 提
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值