服务器作为数据中心里基本计算单元,在任何IDC/机房里都是常见的设备,不过服务器这么多年来,却一直扮演着不那么随和的角色。虽然相比PC机,服务器的可靠性和稳定性高出来许多,可是服务器毕竟还是设备,4个9或者5个9的要求对于服务器还是严苛了许多。从某种角度讲,服务器投入使用到它退出数据中心的几年时间里(通常为3~5年,超期服役的也有大把),每一个环节中的服务器都不能算是一个省心的角色。
在运维团队眼中是这样的:
新服务器到了,要上线,装个系统吧,什么?新服务器没光驱,要外挂光驱安装OS……幸好有USB启动盘,解决了找外挂光驱的难题。神码?一个系统要4张光盘,要做4份USB驱动盘!?……正常工作一年,突然服务器挂了,是什么部件出问题了?电源还是硬盘?内存还是网卡?……这些意外的小插曲每天都在数据中心里出现,为什么没有一个打通安装-管理-监控一条路的工具呢,就像游戏里可以作弊的“金手指”一样……
金手指——原意是这只手指指什么东西就什么东西变成金子,多比喻无所不能的工具。而在这篇文章里,我们要介绍的金手指是超越服务器OS层面的工具,起源是IBM时代的System x服务器提供的基于硬件层的管理模块IMM(Integrated Mangerment Module)。
自从2014年联想收购了System x服务器后,IMM自然也随着System x归属了联想,新一代的联想System x提供的“集成管理模块”也升级到了IMM2,它提供服务器控制和监控功能,视频控制器,以及远程键盘、显示器、鼠标和虚拟驱动器等功能。
IMM2将服务器功能、视频控制器以及远程感知和蓝屏捕获功能整合到一块芯片中,它通过IPMI V2.0和SNMP V3.0来实现监控和管理。IMM2提供高级的服务处理器控制、监控和报警功能,如果环境条件超出阈值或者系统组件发生故障,那么IMM2将点亮指示灯帮助诊断问题,同时将错误记录到IMM2事件日志中,并就该问题向用户发出警报。IMM2支持最高1600×1200分辨率,远程鼠标键盘支持,可以映射CD\DVD\USB等多种存储介质供服务器使用虚拟驱动器。当IMM2检测到操作系统出现挂起情况时,蓝屏捕捉功能就会在IMM重启服务器之前捕获屏幕显示内容,系统管理员可以使用蓝屏捕捉功能来帮助确定出现挂起情况的具体原因。IMM2目前提供 Web界面和Telnet界面两种管理方式。
简单介绍了IMM2是什么,那么它怎么用?其实你只需要一根网线,就拥有了这台联想System x的金手指功能了。把你的电脑用一根网线连接到服务器的IMM2口,那么这台服务器就彻底归你了,从各种软件操作、功能到各种硬件参数的调整,甚至包括了最底层的监控和管理;哪怕你的服务器没有内存、甚至没有CPU,这都不会成为IMM2无法使用的障碍,IMM2依然能进入到远程管理中,如实的反映出系统硬件层存在的各种问题。
说IMM2是金手指一点不为过,从某种角度讲它其实是一套嵌入式的操作系统,直接和System x系列服务器的底层进行了连接,不但可以监测服务器的基本状态,而且完全不受服务器故障的影响。内存坏了?没关系,IMM2能告诉你是哪一条内存出现了故障;硬盘坏了?没关系,IMM2能监控到每一块硬盘是什么时间出现的问题;CPU坏了?没关系,IMM2是独立的一套监控管理系统,仍然能告诉你是CPU挂了……而且它基于网络的应用方式也让运维人员不需要到机器旁边,更不需要把服务器从机柜中抬出来,就能准确定位故障,远程调试、安装OS、维护应用。
IMM2实战演示