随着IT运维管理技术的不断进步,系统工程师已经能够获取网络设备、服务器、网络流量,甚至数据库的警告信息,但又面临着另一个令人头大的问题:成千条警告信息堆积在一起,问题的根源在哪,根本没法判断。虽然不少产品提供了告警过滤和压缩,但结果并不尽人意。工程师依旧没有走出被动式运维的怪圈。
“主动”在IT运维中并不是一个新鲜的概念。
几乎所有的宣传、产品、用户、理念都在宣扬“主动 ”。从被动到主动管理的升华,是每个企业针对信息系统如何提高IT服务水平、提高系统可用性、降低运维成本,实现IT科学性的过程。很多企业在选择IT管理工具时将最终目标就定位在“主动”,希望业务系统能够“无忧”,但真正能够达成IT与业务融合的企业却很少。在以往的企业IT运维工作中,传统被动式运维和类似“救火员”角色的IT系统运维方式,根本不能满足企业的需求。
在虚拟化、云计算等新兴技术的刺激下,IT正在走向一种整合的发展趋势。
当然,这种整合并不局限于几台服务器的集群或组成一个数据中心,而是更多地指向了有序、有效地集中,但也就会导致原有的问题也会集中在一起。大多IT工程师习惯于将工作重心放在性能而不是质量上,放在提供支持而不是消除问题上,永远都在忙着处理问题,却忽略了防患未然。
在传统IT运维工作的管理中,就有一些技术工程师将自己查找日志而排除问题的能力拿出来炫耀,但在“业务集中之后”,这种排查日志的技能几乎葬送了自己所有的工作时间。因此对于“问题管理”,在“集中之后”更多的企业不但需要