基础设施管理:从传统到现代的变革
1. 基础设施管理的现状与挑战
在当今的 IT 领域,软件和工具固然重要,但人们如何思考并有效运用这些工具,以及建立相应的系统、流程和习惯同样关键。然而,大多数 IT 团队往往被紧急事务缠身,无暇顾及能带来长期效益的重要工作。例如,重要的基础设施管理任务常被推迟或搁置。这并非是人员的问题,而是他们所使用的流程和工具存在不足。表现不佳的 IT 和运维团队通常只能应对日常需求,缺乏长远规划的能力。
要更可靠、可重复地交付基础设施,关键在于更好的自动化和流程。以看板管理为例,让基础设施团队跟踪工作并使其可视化,能提高透明度,推动任务完成,还能限制正在进行的工作量,避免员工同时处理多项关键任务而不堪重负。真正关心员工的管理者和组织,会关注员工在紧急但无增值任务上花费的时间(谷歌的 SRE 运动称之为“苦差”),并确保这类工作时间得到控制,至少让员工 20%,最好 50% 的时间用于更有价值的未来工作。
2. “宠物”与“牛群”:两种基础设施管理理念
传统上,我们将服务器视为“宠物”。比如名为 Bob 的邮件服务器,一旦它出现故障,所有人都会全力以赴修复,因为 CEO 收不到邮件会被视为重大问题。而在新的管理理念中,服务器被当作“牛群”,像编号从 www001 到 www100 的服务器,当其中一台出现故障时,会被直接替换。
那些独特、不可或缺且不能停机的大型机、服务器、网络组件或数据库系统就是“宠物”。它们是手动构建的,有独特的名称,维护这些静态且日益陈旧的环境成为工作的重要部分。Gene Kim 称这些珍贵且难以替代的设施为“艺术品”,Martin Fowler 则称之为“雪花环境”,每台服务器都有独特的配置
超级会员免费看
订阅专栏 解锁全文
1132

被折叠的 条评论
为什么被折叠?



