云智慧 AIOps 社区是由云智慧发起,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交流社区。该社区致力于传播 AIOps 技术,旨在与各行业客户、用户、研究者和开发者们共同解决智能运维行业技术难题,推动 AIOps 技术在企业中落地,建设健康共赢的AIOps 开发者生态。
运维服务管理的问题与挑战
数字化转型背景下的IT运维
随着业务的不断创新发展,敏捷开发、容器化、云计算等新技术的应用越来越多,与此同时,业务系统架构也变得越来越复杂,传统运维工作将会面临更多、更大的挑战。因此,确保 IT 系统的持续健康是保障用户体验和业务发展的基础。在上述背景下,云智慧将运维存在的挑战分为人员、流程、技术三个维度:
- 人员方面:现阶段,IT运维人员总是被动开展工作且重复性操作较多,在面对数百上千设备以及快速迭代的技术栈时,因缺乏标准化的管理,使得愈加庞大的业务系统难以应对;
- 流程方面:IT运维类的管理制度标准化程度不足;运维人员工作负荷也难以量化体现且缺乏认同感。
- 技术方面:在面对庞大的设备和系统数量时,企业缺少自动化技术手段进行管理,导致企业对业务系统的可用性预警不足,运维工作被动。
IT运维中面临的现状与痛点
基于上述对运维背景及挑战分析,云智慧将企业 IT 运维典型问题归纳总结为以下几个方面:
- 流程与制度不完善,存在沟通灰度;
- “建转运”过程不规范,效率低,运维工作量化能力弱,无法形成考核依据;
- 缺乏运维知识沉淀;
- 缺乏 AI 技术在运维服务管理中的应用。
新一代IT服务管理是业务与技术发展的必然
在上述的挑战下,运维服务管理的理论和工具都有了新的变化。ITIL 4 引入了服务价值体系的概念,它可以为组织提供一个强大的、统一的、以价值为中心的方向。随着企业数字化的转型和发展, IT 服务共享中心正在成为企业 IT 的重要服务支点,如何在工具中体现对共享服务型组织的支撑,成为了新一代ITSM 的重要方向。 在今年的 ITSM 工具关键能力报告中, Gartner提到了一个重要的能力-AITSM,即人工智能在 ITSM 中的应用,例如基于人工智能的虚拟助理机器人,为用户提供对话式自助IT服务;结合知识库实现自动解决方案推荐;基于深度学习的类似工单等应用场景。以上均为新一代 ITSM 的技术发展和应用。
此外,ITIL 4 在新时代客户体验、价值流和数字化转型的背景下,重新提炼了更多的 ITSM 实践,也采用了新的工作方法(如精益、敏捷以及DevOps),也促使 ITIL 跟上了新时代。云智慧在理论和前沿技术的指引下,推出了云智慧数字化服务管理解决方案。
解决方案
- IT服务管理体系—夯实组织信息化建设基础
数字化运维的完整场景为当业务用户方提出服务需求时,IT运维组织则会通过各种管理流程和活动来提供服务促进价值共创。 一个企业信息系统价值的实现,30%在于建设,70%在运维,稳定运行才能发挥业务价值。 数字化运维服务管理的核心价值在于标准化、规范化、精细化管理。 从业务用户角度出发,便捷地申请服务请求、申报故障以及提出新需求是他们关注的重点。与此同时,问题解决过程快速,过程可视化,对于业务用户来说也是良好的服务体验。以上过程的实现背后则需依赖于科学的管理流程和运维组织支撑。 从IT运维组织角度出发,规范化、可量化IT服务则是重中之重。因此,运维管理则需要提供服务目录以及考核运维流程指标。此外,配置管理也是整个运维场景中的核心要素,它会为其他流程提供配置项信息数据,支持其他流程运转。例如,在变更管理流程中,配置管理可以提供变更影响分析,帮助评估变更风险和召集变更评审人员;同时,配置管理也为运行综合分析和自动化作业、容量管理等场景提供基础数据。