DellTM PowerEdgeTM 服务器中包含的Dell OpenManageTM Server Administrator帮助管理员有效地管理他们的服务器。Server Administrator中的诊断服务方便了对Dell硬件问题的解决。本文关注的焦点是在运行Microsoft® Windows® 和Red Hat® Linux® 操作系统的Dell系统上部署诊断服务。
Dell
TM OpenManage
TM Server Administrator提供了众多服务,帮助管理员在本地和远程管理和监视Dell系统:仪器,远程访问,存储管理,诊断和升级
1 。管理员使用这些诊断服务,可以更为方便地避免系统性能下降,诊断出现故障的部件上发生的问题。诊断服务使系统管理员可以完成监视系统硬件的整体健康状况。Server Administrator诊断服务的优点包括:
|
本文对于如何更有效地在企业计算环境中使用Server Administrator提供了一些建议。
诊断服务可以在本地访问,也可以通过基于Web浏览器的图形用户界面(GUI)在远程访问。诊断服务还可以通过命令行接口(CLI)在本地访问,便于利用脚本功能。诊断服务仅对Windows上具有Power User或Administrator访问权限或在Linux具有root权限的用户提供。本文探讨了管理员如何使用两种界面来运行诊断。
通过GUI运行诊断
要通过GUI运行诊断,管理员可以点击Server Administrator主窗口中的Diagnostics页面,然后点击"View"。在屏幕左侧的导航树中列出了所支持的部件,诊断选择窗口中列出了可能的测试。Server Administrator中的诊断工具可以在两种模式下运行:交互模式和计划模式。
运行交互式诊断
当管理员怀疑系统中的某些硬件部件出现问题或者他们已被通知必须要诊断问题时,往往使用交互式或实时的模式。通过诊断选择屏幕,管理员可以选择"根据设备查看"或"根据测试查看"。
为测试服务器的速度减慢,管理员可以在所有的硬盘驱动器上运行测试,并检查系统中DIMM(双列直插内存模块)的状况。选择根据测试查看,然后选择"Surface Scan Test(表面扫描测试)"将会显示所有的硬盘驱动器选择界面。系统管理员这时可以选择根据设备显示和"物理内存设备"来显示当前用户准备运行测试所进行的所有选择。一旦管理员已经选择所需的设备和测试,他们就可以点击"Advanced(高级)"来选择以压力模式来运行测试可以选择的选项。
在压力模式下运行交互式诊断
诊断压力模式选项模拟了长期使用系统的场景,其中硬件的故障可能会影响系统的性能。压力模式还模仿可能会降低系统性能的长期的重复性系统使用。在压力模式下运行系统可以帮助系统管理员在问题出现之前发现问题,不会使服务器停机。拥有关键业务的组织需要极高的可用性—例如数据库,将会发现这个特点特别有用。
在高级设置窗口中定义了以下压力模式(参见
图1 )。

图1. 高级诊断设置
|
在管理员选择了高级选项之后,他们点击"Run Tests(运行测试)"启动测试。Server Administrator可以点击Abort(中止)按钮来停止测试,并清空测试队列。有些测试会立即结束;有些测试可能占用较长的时间,因为Server Administrator为保护系统的完整性,允许某些例程结束后在中止测试。在完成诊断测试之后,管理员可以查看结果来确定适当的活动。

图2. 诊断测试的进展
审查打包的诊断运行日志
诊断测试所得到的结果都在本地打包到被管理的服务器文件系统中。这些诊断运行日志可以通过Result History(结果历史)菜单项来访问,其中展示了硬件故障审核轨迹;管理员还可以查看每次诊断运行的结果。运行日志打包的缺省文件大小是2MB,大约可以容纳1,300次运行。在达到文件的最大长度限制之后,日志将循环使用。管理员可以通过Settings(设置)菜单在更改日志文件的大小。
运行计划好的诊断
管理员可以使用诊断服务内的计划功能在以后的日期和时间执行测试;例如在非高峰时间余兴预防性维护任务(参见图3)。计划功能还使管理员可以灵活地在任何时间运行测试,运行无人值守的测试,以及计划重复性的任务。管理员可以查看和比较重复测试的结果,了解趋势。

图3.诊断测试计划
c
因为计划器使用本地OS的功能,所以计划的执行动作的权限与被管理的系统客户的权限相同。计划任务所指定的日期和时间也是被管理的系统的时间。来自计划性的运行的结果被张贴到诊断结果历史日志中。使用诊断计划和结果日志检查,管理员可以在出现问题之前,发现系统的变化、将会出现故障的部件,或可能降低系统性能的其它趋势。
检测系统部件的变化
诊断服务还提供了检测系统清单的变化的能力。在第一次安装时,Server Administrator诊断服务捕捉系统硬件配置的映象,并将它保存为基线配置。当被管理服务器或安全端口服务器重启的时候,检测算法捕捉了硬件配置的另一个映象。Server Administrator诊断服务将新的配置与基线相比较,并在配置变更日志中显示变化(参见
图4 )。管理员必须认可这一配置上的变化才能将状态指示器从报警状态转换到正常状态。在认可后,新的配置将变为基线。

图4. 诊断服务硬件配置变更日志
绿色的对号图标表明硬件已经添加到指定的服务器中。
图4 表明一个新的SCSI控制器添加到系统中。红色的"X"图标表明已经从系统中删除硬件或硬件的配置不再正确,或是出现故障,导致诊断服务无法诊断它们。
如果同一个设备在硬件配置变更日志中出现两次,具有相同的时间戳,并且已经被绿色的对号和红色的"X"所标记,则表明设备硬件或OS的位置可能已经发生变化。在
图4 中,日志显示了网络接口卡(NIC)的移走已经导致硬盘驱动器被分配到不同的外设部件互连(PCI)总线位置。
硬件配置的这些变化已经被打包,可以通过配置历史菜单项来访问。管理员可以通过电子邮件来发送这些日志,将它们保存在选定的地点。Server Administrator将日志作为电子邮件的附加来发送。附件中包括目前硬件的配置映象和诊断测试执行历史日志。管理员可以使用附件的日志,在将来进行检查和打包。
通过CLI运行诊断
不希望安装安全端口服务器或使用GUI的管理员可以通过Server Administrator CLI来运行诊断。CLI使管理员可以:
|
包含有诊断命令的CLI脚本被广泛地在非高峰时间在被管理的服务器上执行,以便减轻对生产运行环境的影响。管理员可以使用Microsoft系统管理服务器、ftp或是内部的可以在一组服务器上执行脚本的机制来散发这些脚本。这样,管理员就可以在被管理系统网络中执行预防性的诊断。
2
编写诊断CLI命令
所有的诊断CLI命令都用omdiag关键字开头。使用-?选项可以查看所有诊断命令的帮助。管理员可以收入omdiag -?来查看与运行诊断命令相关的帮助信息。
与GUI相比,使用CLI
3 的主要优势包括:
|
管理Dell服务器,提供更长的稳定运行时间
Dell OpenManage Server Administrator为管理员提供了一组强大的管理功能,帮助保持系统的稳定运行。这个应用中包括的GUI和CLI界面提供灵活地监视和维护任务的方法。Server Administrator诊断服务用来帮助管理员最小化停机时间,使它们可以解决问题,发现系统利用率的趋势。因此,这个工具可以帮助管理员有效地管理他们的Dell服务器,帮助提高他们IT环境的可靠性和可用性。
转载于:https://blog.51cto.com/qingwang/126489