《AIX 故障定位方法》
1 定义故障
- 弄清楚系统发生了什么问题
- 系统现在能做什么?不能做什么?
- 故障什么时候发生的?
- 有没有做平时不同的操作?
- 故障有没有规律?定时还是不定时?发生的频率有多高?
- 是一台机器出现故障还是多台机器故障?故障现象是否相同?
- 最近有没有做改动?如安装了新的硬件、软件,改变了系统的一些设置。
2 收集故障信息
(1)收集故障信息对于判断、诊断故障原因,修复系统非常重要。
(2) 系统故障记录(errorlog)
errdemon 进程在系统启动时自动运行
记录包括硬件、软件及其他操作信息
故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析
errpt 命令的使用(普通用户权限也可使用)
# errpt |more 列出简短出错信息
( 3) 控制面板上的LED 代码
8 位代码,通常系统故障灯会同时亮起。某些机型还会同时显示故障设备位置代码。
4 位代码,通常是Exxx。
3