架构中运维定义的全面解析
1. 理解运维管理
在企业架构中定义运维管理之前,我们需要先了解 IT 运维包含哪些内容。DevOps 往往侧重于开发,关注新特性和新产品的探索与构建,在发布管理和 CI/CD 讨论中,也多聚焦于开发和部署过程。但实际上,运维与开发同样重要,而且 IT 运维的角色正在发生变化,这不仅归因于 DevOps,还与众多企业正在经历的数字化转型有关。
简单来说,IT 运维涵盖了企业为满足客户服务而使用的硬件和软件的所有支持流程。它不仅要确保终端用户设备(如笔记本电脑)的功能正常,还要保障为企业客户提供服务的产品稳定运行。例如,一个供客户订购商品的网站,包括其基础设施(Web 服务器)和应用代码(前端应用和数据库),都在 IT 运维的管理范围内。此外,IT 运维在确保 IT 资产质量方面也承担着重要任务。
IT 运维管理(ITOM)中几个重要的流程如下:
- 监控 :IT 运维是 IT 的“眼睛”,因此强大、可靠的监控系统至关重要。监控并没有一种通用的方法,运维人员需要与不同的系统协作,以控制基础设施、应用程序、接口、备份作业等众多组件。挑战在于从这些系统中获取一个全面的视图,以便关联系统状态、故障和潜在问题。例如,Web 服务可能因数据库不可用而无响应。端到端监控是 IT 中常用的术语,意味着监控系统模拟整个 IT 系统链中的事务。
- 事件管理 :任何干扰系统正常运行的事件都被视为事件。运维人员需要通过监控识别事件,并尽快解决。可以通过应用临时解决方案使系统恢复正常,但最好是修复问题并确保不再发生,这就是问题管理的核心。
- 问题管理 <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



