关于系统补丁:
查看系统当前ML
bash-3.2# oslevel -r
5300-08
bash-3.2# instfix -i | grep ML
All filesets for 5.3.0.0_AIX_ML were found.
All filesets for 5300-01_AIX_ML were found.
All filesets for 5300-02_AIX_ML were found.
All filesets for 5300-03_AIX_ML were found.
All filesets for 5300-04_AIX_ML were found.
All filesets for 5300-05_AIX_ML were found.
All filesets for 5300-06_AIX_ML were found.
All filesets for 5300-07_AIX_ML were found.
All filesets for 5300-08_AIX_ML were found.
查看系统当前SP版本
bash-3.2# oslevel -s
5300-08-04-0844
此处,08是ML,04是TL,0844是SP
关于ODM:
相关目录:
/etc/objrepos
/usr/lib/objrepos
/usr/share/lib/objrepos
这三个目录下的文件也被称为object classes.
可以使用命令"odmget <class>"来查看组建族中的信息而不会对系统造成影响.
且这里的<class>是指/etc/objrepos目录下的一个组建族
AIX中提供了几个ODM命令直接对ODM进行操作:
odmshow 查看ODM结构
odmadd 将新记录加入ODM库中
odmdelete 从ODM库中删除记录
odmcreate 按照给定结构生成新ODM库
odmchange 更改ODM库中内容 //odmchage=odmdelete+odmadd
odmdrop 删除一个ODM库
odmget 取出ODM库中数据,不影响当前ODM
ODM库文件所在位置变量:
bash-3.2# echo $ODMDIR
/etc/objrepos
关于进程、线程:
每个CPU在同一时刻,只执行一个线程,一个线程完毕后退出或者主动进入sleeping状态、线程等待其他I/O操作、有中断操作(in)、达到此线程最大允许运行时间,则操作系统就会强制进行线程切换(cs=content switch),让CPU去执行另外一个线程.
关于VMSTAT结果:
bash-3.2# vmstat 1 5
System Configuration: lcpu=4 mem=3920MB
kthr memory page faults cpu
----- ----------- ------------------------ ------------ -----------
r b avm fre re pi po fr sr cy in sy cs us sy id wa
0 0 564186 5429 0 0 0 0 0 0 4 2109 547 0 0 99 0
0 0 564186 5429 0 0 0 0 0 0 1 2074 537 0 0 99 0
0 0 564186 5429 0 0 0 0 0 0 1 1916 521 0 0 99 0
0 0 564186 5429 0 0 0 0 0 0 2 1708 512 0 0 99 0
0 0 564186 5429 0 0 0 0 0 0 1 2267 524 0 0 99 0
r: 当前队列中等待执行的线程数,如果这个值非常大,是3-5倍cpu数,可能存在性能瓶颈,对大型应用系统除外.
b: 当前队列中处于等待状态的线程,由于I/0操作未完成,无法继续执行,如果这个值非常大,是3-5倍cpu数,可能存在I/O瓶颈
avm: 是active memory,它等于当前所配置的物理内存值+swap-作为文件系统缓存的物理内存,单位4KB
fre: 空闲的物理内存
pi: page in 物理内存,swap to memory
po: 物理内存 page out,memory to swap
re: pi/po
fr: 代表多少当前未被使用到的物理内存被释放
cs: content swtich,cpu切换到另一个线程上去执行
us: 系统中用户所在CPU时间百分比
sy: 系统中系统调用所占CPU时间百分比
wa: 系统等待磁盘I/O所占时间比,wa的高低并不一定就代表存在I/O问题,它与us、sy、id成比例关系.
关于查看系统进程:
查看系统全部进程:
ps -ef
查看各进程占用的CPU情况:
// u = cpu
ps -aux
查看某用户的进程CPU情况:
ps -lu oracle
查看所有线程情况:
ps -kef
僵尸进程:
ps as <defunct>
僵尸进程除了占用进程号之外,不会消耗其他系统资源,如果系统当前有很多defunct,可重启解决.
关于DUMP:
分两类:
1. 程序core dump,目录下会产生一个CORE文件
2. 系统 system dump或者system crash,机器停机
估计当前系统可能出现的dump文件的大小:
bash-3.2# sysdumpdev -e
Estimated dump size in bytes: 237397606
bash-3.2# sysdumpdev -l
primary /dev/hd6
secondary /dev/sysdumpnull
copy directory /var/adm/ras
forced copy flag TRUE
always allow dump FALSE
dump compression ON
DUMP是一个逻辑卷,它用来装载DUMP。同时,DUMP设备还允许将DUMP出来的数据在下一次启动后,复制到指定目录. ( /var/adm/ras/ )
所以需同时注意/dev/dumplv和/var/adm/ras的大小
关于内存芯片:
1. 内存的配置要求: 中、高端的内存都有偶数对的需求,这是chipkiller技术的要求,用来达到内存校验,类似硬盘RAID的技术.
2. 小机上的内存条都是统一按位置插在一个叫memory book的盒子里,再由盒子统一插到主板上去.
关于ChipKiller技术:
ECC= ERROR CHECKING AND CORRECTING 出错发现与纠正.
ECC能检查并纠正所出现的single bit 报错,但对两位bit的错误,它只能发现,不能纠正.
所谓的chipkiller技术,是ibm设计的一种内存配置技术,类似于硬盘RAID保护,当读书数据的时候,不是一次从一条内存上读取,而是同时从多条内存上读取,这样即便其中一根内存出现故障,它也会被发现并更正.
这种方式需要一对、4条、甚至8条一组进行装载,且内存型号、参数必须严格相同.