目录
1.前言
银行等信息化程度高的行业,随着业务的持续发展和不断创新,IT系统不断壮大,IT运维已经成为IT服务内涵中重要的组成部分。面对越来越复杂的业务,面对越来越多样化的用户需求,数据中心基础设施规模随之不断扩大,服务器、存储、数据库、网络资源等需求愈加旺盛,系统架构日趋复杂;在互联网和智慧化建设背景下,包括智能营销和精准获客在内的新需求大量涌现,促使应用架构呈现多元化发展趋势;监管要求日趋严格,现场监管和非现场监管、内部审计和外部审计相结合的方式,对运维标准化、规范化、合规性提出了更高的要求。
不断扩展的IT应用需要越来越合理的模式来保障IT服务能灵活便捷、安全稳定地持续保障,这种模式中的保障因素之一就是IT运维。从初期的几台服务器发展到庞大的数据中心,单靠人工已经无法满足在技术、业务、管理等方面的要求,那么标准化、自动化、架构优化、过程优化等降低IT服务成本的因素越来越被人们所重视。其中,自动化最开始作为代替人工操作为出发点的诉求被广泛研究和应用。
所谓自动化运维是指通过将日常IT运维中大量的重复性工作(小到简单的日常检查、配置变更和软件安装,大到整个变更流程的组织调度)由过去的手工执行转为标准化、流程化和自动化操作。
自动化运维通过制定IT运维工作的规范规则,辅助技术手段,促进IT运维工作尤其是应用运维的规范化、流程化和自动化, 提高工作效率,降低运行风险。宏观能通过图表流程等直观友好方式向普通运维人员和管理人员展示运维进程和运维成果, 微观能给后台技术人员提供尽量详细实时的运行情况和事后分析记录。
目前,自动化运维基本上都是以计算机主机、操作系统为对象的系统层面的操作,我称为基于系统层面的自动化运维。本文试图从应用层面探讨自动化运维的实现思路,系统运维实质性是对操作系统本身运行维护的一种特殊应用运维,业务作为一种或者多种应用系统的功能,通过业务--应用关联实现业务的应用遍历查询,通过与流程审批管理、服务管理等系统对接实现业务维护的自动化, 从而实现全方位多角度的自动化运维平台。
应用层面的自动化运维已在某银行做了很多落地实践,效果很理想。由于是探索式开发,有些方面还有待完善,本文既是对以往工作的总结,也想从理论上做更深入全面的研究,供自动化运维平台建设和开发的专家们参考。
2.概述
2.1 相关名词
-
业务:
指各行业中需要处理的事务,但是通常偏向指销售的事务。在IT中,指按某一共同的目标,通过信息交换实现的一系列过程。在银行IT系统中,业务大多不是独立的系统,或多或少在有多个应用系统中交流。
IT运维的最终目的为各式各样的业务服务,很多IT运维事件也是源于业务问题。业务问题实质上是应用系统功能不完善或者程序实现缺陷,业务问题的运维操作实质上是对应用系统的功能修补或者是一种特殊的业务交易,原则上都可通过应用系统的优化升级根除该类操作。 -
系统软件:
指控制和协调计算机及其外部设备,支持应用软件开发和运行的系统,是无需要用户干预的各种程序的集合。我们一般指操作系统、数据库以及中间件等辅助的成熟的软件。
-
应用系统:
指专门为满足不同领域、不同问题的应用需求而编制的软件, 分为应用软件包和用户程序。譬如:银行的核心系统、前置系统、中间业务系统、财务系统等等。
-
运维:
运维是一个非常广泛的定义,在不同的公司不同的阶段有着不同的职责与定位,最基本的职责是保证业务稳定运行。大型的公司对于运维工作要求越来越高,分工也越来越细,从大的方向可分为网站运维、系统运维、应用运维、网络运维、数据库运维、安全运维等等。
-
CMDB:
CMDB——Configuration Management Database 配置管理数据库。CMDB存储与管理企业IT架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。
2.2 相互关系
业务、应用、系统、数据、运维等之间从定义和目标方面是各有侧重点又紧密联系的,大致关系如下图:
从上图中分析,业务、应用、服务器之间都存在一对多的关系, 自动化运维控制的基本单位是应用系统所需的各服务器。服务器及其网络等系统运维方面的管理要素相对统一简单,因此自动化运维基于服务器资源的系统运维是比较成熟广泛的。
应用层面处于整个运维环节的中心位置,与业务和资源关系最密切,因此,基于应用层面建设自动化运维将大大扩展自动化运维的使用范围和使用效果。
CMDB,几乎是每个运维人都绕不过去的字眼,但又是很多运维人的痛,因为CMDB很少有成功的,因此我也把它称之为运维人的耻辱。其中失败原因大都可归结到CMDB很难做到与实际工作同步变更,造成信息的过时或错误,最终失去使用价值。
如果从应用层面建设自动化运维系统,再丰富服务器网络等底层资源信息和管理控制,丰富业务层次的关联信息,这些实际上已极大地满足了CMDB的信息要求,只要增加同步CMDB数据库机制,或者按照CMDB数据规范直接查找自动化运维数据库展示各种配置