设备故障绝对是不便之处。 发生故障的设备类型可能是可交换硬件的,例如风扇冷却单元或热交换外围组件互连(PCI)卡。 在这两种情况下,您都需要知道设备的物理位置以进行更换。 因此,您需要知道设备的位置代码。 出现故障的设备将显示在错误报告中(使用errpt
命令),在该位置还将张贴物理位置代码。 另外,使用lscfg
命令还可以告诉您设备的物理位置。 获取位置后,如何定位设备?
AIX内部代码和物理代码
AIX提供了两种不同的代码,它们分别是:
- IBMAIX®(内部)位置系统代码
- 实际位置代码
AIX内部位置代码可以与物理代码一起使用来标识设备,正如我们将在本文后面看到的那样。 使用AIX生成的设备引用了某些设备,例如:
10-80-00-3,0 SCSI CD Drive
10-80-00-2,0 SCSI disk
02-08-00 SAS disk
上面的代码是实际设备的内部路径,可以使用lsdev
命令查看。
另一个是物理类型的位置代码,而我们特别感兴趣的是由固件生成的。 例如:
U789C.001.DQD3F62-P2-D3 SAS Disk Drive
自几年前发布IBM POWER5处理器以来,物理位置代码是查找设备的首选方法。 通常,物理代码通常就是您所需要的。 这就是我在本文中重点讨论的内容。 表1中提供的命令使您能够获取有关设备的各种信息。
表1.用于获取有关设备信息的命令
命令 | 描述 |
---|---|
lsdev -C -H -F "name status physloc location description" | 获取AIX(如果存在)和物理位置代码。 |
lsdev -Cc disk -F 'name location physloc' | 获取所有磁盘的AIX和物理位置代码。 |
lsdev -Cl hdisk0 -F physloc | 获取hdisk0的位置码。 |
lscfg -vpl hdisk0 | 获取fhdisk0的扩展信息。 |
lsdev -C| grep hdisk0 | 获取hdisk0的AIX位置代码。 |
lsparent -Cl hdisk0 | 获取hdisk0的父设备。 |
lscfg -l fcs0 | 获取有关fsc0设备的信息。 |
使用IBM信息中心或红皮书
如何使用物理位置代码找到设备? 这取决于您所使用的系统类型,因为这些类型在系统范围内可能会略有不同。 始终确保您拥有服务器系统手册或参考IBM信息中心的在线信息。 这些参考资料提供了模型的示意图,包括系统的位置代码,以便于识别。 但是,在声明了一切都不会丢失之后,有一些方法可以物理地识别设备。
代码是什么?
物理设备的位置代码来自固件方面。 如果正确遵循位置代码,则它最终会指向您要查找的设备。
无论您拥有什么服务器,位置代码的实际格式都是相同的格式,只是代码(以数字/字母表示)可以指向系统上的其他物理位置。 到目前为止,可定位设备的第一个字符始终为“ U”。 接下来,它变得有趣。 此处是位置代码的一般格式,并带有一个示例,该示例取自IBM Power Systems™520模型(落地式),除非另有说明,否则该示例仅用于示例。 除非另有说明,否则所有位置代码示例均为实际位置。
单元外壳类型 | 机壳型号 | 序列号 | 位置 |
---|---|---|---|
U789C | 001 | DQD3F62 | P2-D3 |
字段位置是单元/抽屉的单元/型号序列号。 您的系统可能包含不同的单元外壳类型。 不要期望您所有的位置代码都具有相同的外壳。 如果您具有扩展插槽(例如附加的磁盘抽屉),则尤其如此。
在本文中,位置字段是有趣的部分。
如果无法确定物理位置,则AIX会假定它是逻辑设备,该逻辑设备有时已链接到物理设备。 通常,这些设备可以是连接到外部存储设备的逻辑设备,例如独立磁盘冗余阵列(RAID)SCSI设备或磁带机。 根据硬件类型(例如SCSI,串行,tty和适配器),代码可能具有不同的含义。
位置代码可以由几个前缀字母和数字组成。 常用前缀如表2所示。
表2.通用前缀
代码前缀 | 描述 |
---|---|
一个 | 通风装置,例如风扇 |
C | 卡,例如,PCI插槽,内存插槽 |
d | 设备,例如磁盘插槽,磁盘抽屉 |
Ë | 电气,例如电源 |
大号 | 逻辑路径,例如光纤通道 |
P | 平面(例如,系统或I / O背板,系统板) |
Ť | 接口连接器/端口(例如,串行端口),通常后跟数字以表示哪个端口 |
ü | 单元 |
V | 虚拟平面 |
那是一个代码
现在让我们来看一个示例,例如hdisk0。 以下是lscfg
对hdisk0的部分输出:
lscfg -vpl hdisk0
hdisk0 U789C.001.DQD3F62-P2-D3 SAS Disk Drive (146800 MB)
Manufacturer................IBM
Machine Type and Model......ST3146356SS
FRU Number..................10N7204
ROS Level and ID............45363045
Serial Number...............3QN2JFEP
Hardware Location Code......U789C.001.DQD3F62-P2-D3
PLATFORM SPECIFIC
Name:disk
Node: disk
Device Type:block
查看上面的lscfg
输出,它首先告诉我这是SAS磁盘,但让我们更仔细地看一下位置代码,然后将其分解:
U789C.001.DQD3F62-P2-D3
码 | 描述 |
---|---|
U789C | 单位类型 |
001 | 机壳型号 |
DQDS3F62 | 序列号 |
P2 | 平面2(可从设备正面访问) |
D3 | 设备插槽3(磁盘驱动器号1,它是左侧第一个托架中的第二个托架)。 |
我怎么知道以上所有内容? 通过使用我的红皮书并使用模型的示意图表示法引用位置,我确切地知道了它的位置!
通常,您会发现仅由位置代码而非系统详细信息引用的位置代码。 如果所有设备都位于同一平面上,则肯定是正确的,在这种情况下,将使用以下格式:Un <location>
处理卡插槽时,这些插槽可能包含双端口,例如以太网卡或光纤卡。 如果是这种情况,则该位置将具有与之关联的字母“ T”,并且T后面的数字是端口号。 如果某个位置有“ T”但没有卡插槽(位置代码中没有C),那么您可以确信这是一个集成的(板载)接口。 在这里,我正在考虑串行端口或以太网端口。
现在让我们将注意力转向光纤卡插槽。 查看光纤卡(fcs0)的位置:
lscfg -vl fcs0
Physical Location: U789C.001.DQD3F62-P1-C1-T1
查看位置代码:
P1-C1-T1
我们知道:
码 | 描述 |
---|---|
P1 | 平面1.可从装置背面访问。 |
C1 | 卡(PCI)插槽1。这是从设备顶部向下看的第一个PCI插槽。 |
T1 | 这是第一个端口(上端口)。 |
查看一个集成(板载)端口,例如硬件管理控制台(HMC)以太网端口:
P1-T5
我们知道这不是卡,因为该位置没有“ C”。
码 | 描述 |
---|---|
P1 | 平面1.可从装置背面访问。 |
T5 | 插槽5。位于机器左侧。 左端口。 |
判断设备是否可以在板上的另一种方法是,该设备何时还返回AIX内部位置代码。 例如,以Power Systems 570型号为例,以下是几个以太网设备:
ent0 Available 02-08 2-Port 10/100/1000 Base-TX PCI-X Adapter (14108902)
ent1 Available 02-09 2-Port 10/100/1000 Base-TX PCI-X Adapter (14108902)
ent0 U7879.001.DQD1AE7-P1-T6
ent1 U7879.001.DQD1AE7-P1-T7
上面的AIX内部位置代码(02-08和02-09)通知我们,以太网设备都使用相同的地址位置02。由于物理位置中没有“ C”,即没有卡槽,我们可以假设这是板载双端口。 根据经验,如果您有两个车载设备T1和T2,如果一对是水平的,则T1在右侧,T2在左侧。 如果设备是垂直的,则T1将在顶部,而T2在其下方。
许多系统都有存储区域网络(SAN)存储。 最好了解一下如何查找逻辑单元号(LUN),并查看hdisk0,它是570型的IBM SystemStorage®DS3400磁盘系统:
lscfg -vl hdisk20
hdisk2 0U7879.001.DQD1AE7-P1-C2-T1-W202500A0B85B6194-LE000000000000 MPIO Other DS3K Array Disk
上面的输出很长。 因此,让我们看看该位置代码的作用:
码 | 描述 |
---|---|
P1 | 平面1(可从设备背面访问) |
C2 | 卡(PCI)插槽2光纤卡 |
T1 | 第一个光纤端口(顶部) |
W202500A0B85B6194 | 远程SAN交换机上的全球端口标识符 |
LE000000000000 | 远程磁盘的(逻辑)LUN ID(十六进制值) |
某些代码的字母“ L”后跟数字,这些是逻辑路径。 逻辑路径的典型用户是包括RAID磁盘在内的SCSI磁盘。 例如,下面显示了一个SCSI磁盘阵列位置:
P1-C8-T1-L0-L0 SCSI RAID 5 Disk Array
热插拔
知道您的PCI热插拔卡总是有好处的,因为如果热插拔设备发生故障,则需要几分钟来更换它们。 要查看PCI热点,请使用以下命令:
lsslot -c pci
# Slot Description Device(s)
U789C.001.DQD3F62-P1-C1 PCI-E capable, Rev 1 slot with 8x lanes fcs0
U789C.001.DQD3F62-P1-C2 PCI-E capable, Rev 1 slot with 8x lanes fcs1
U789C.001.DQD3F62-P1-C3 PCI-E capable, Rev 1 slot with 16x lanes Empty
U789C.001.DQD3F62-P1-C4 PCI-X capable, 64 bit, 266MHz slot Empty
U789C.001.DQD3F62-P1-C5 PCI-X capable, 64 bit, 266MHz slot Empty
我们已经尽力介绍了fcs0卡的位置。 但是,我们可以看到两个活动卡(fcs0,fcs1)彼此相邻。 我们已经知道fcs0是第一张卡,并且在插槽的顶部。 因此,第二个是fscs1卡。 其他三个插槽P1-C3,C4和C5未分配。
要查看所有逻辑交换,请使用以下命令:
lsslot -c slot
快速获取该位置代码
如果您仍然对这些位置感到困惑,并且您的设备出现故障,而IBM工程师正在敲门,希望您知道发生故障的设备在哪里,那么您可以随时进行“ SMIT诊断”并找出发生故障的设备。 这也会告诉您位置代码。 在进行此操作之前,请务必先检查您的errpt,以确认您在标识正确的设备。
修复注意指示灯闪烁
设备出现故障后,您可以通过琥珀色闪烁的指示灯或登录到HMC时的符号来识别它。 更换或固定设备后,可使用以下方法将状态恢复为正常:
/usr/lpp/diagnostics/bin/usysfault -s normal
结论
因此,现在您知道了位置代码如何为您提供帮助。 如前所述,如果要更换设备,则需要知道这一点。 但是,如上所述,它在很大程度上取决于您是否可以访问系统硬件文档,因为这些文档取决于您的特定系统。
翻译自: https://www.ibm.com/developerworks/aix/library/au-aix-decoding-location-codes/index.html