目录
系统管理员必须了解核心设备的连接方式,便于故障隔离和故障定位。
1.2硬件设备清单
目前系统采用的硬件设备种类有小型机、存储服务器、PC服务器、磁带库等。
设备清单:
1.3软件系统配置清单
目前涉及的软件有操作系统、集群软件、数据库系统、备份系统、中间件平台、银行联网实时代收系统、95598客服接口等。下附各地软件系统详细清单。
软件系统清单:
以下从小型机主机系统、集群系统、存储系统、数据库系统、备份系统这几大方面,提出日常需要检查的项目。
1.4.1 应用服务系统
1.4.1.1 应用服务运行状态检查
检查是否有对应weblogic server实例服务的进程
zbyxapp01:/#ps -ef|grep java
root 299154 385142 0 14:50:28 pts/4 0:00 grep java
root 340088 221334 2 Jan 03 - 30479509:52 /usr/java14/bin/java -Xms512m -Xmx768m -Xrs -Dweblogic.Name=proxyServer -Dweblogic.management.username=weblogic -Dweblogic.management.password=weblogic -Dweblogic.management.server=http://10.158.134.25:6101 -Djava.security.policy=/beawlsp4/weblogic81/server/lib/weblogic.policy -Djava.awt.headless=true weblogic.Server
root 344302 278530 0 Jan 03 - 2:26 /usr/java14/bin/java -Xms200m -Xmx256m -Xrs -Dweblogic.Name=myserver -Dweblogic.ProductionModeEnabled= -Djava.security.policy=/beawlsp4/weblogic81/server/lib/weblogic.policy -DINDIGO_HOME=beaapp weblogic.Server
root 352256 331870 54 Jan 06 - 496:14 /usr/java14/bin/java -Xms768m -Xmx1024m -Xrs -Dweblogic.Name=MyServer1 -Dweblogic.management.username=weblogic -Dweblogic.management.password=weblogic -Dweblogic.management.server=http://10.158.134.25:6101 -Djava.security.policy=/beawlsp4/weblogic81/server/lib/weblogic.policy -Djava.awt.headless=true weblogic.Server
zbyxapp01:/#
|
1.4.1.2 应用服务器运行性能检查
检查应用服务器的运行性能
zbyxapp01:/#topas
Topas Monitor for host: zbyxapp01 EVENTS/QUEUES FILE/TTY
Tue Jan 9 14:59:12 2007 Interval: 2 Cswitch 430 Readch 86638
Syscall 3756 Writech 952
Kernel 0.9 |# | Reads 1255 Rawin 0
User 13.3 |#### | Writes 23 Ttyout 532
Wait 0.0 | | Forks 0 Igets 0
Idle 85.8 |######################### | Execs 0 Namei 129
Runqueue 0.0 Dirblk 0
Network KBPS I-Pack O-Pack KB-In KB-Out Waitqueue 0.0
en4 119.6 146.5 127.0 57.1 62.5
lo0 36.9 44.0 43.5 18.5 18.4 PAGING MEMORY
Faults 55 Real,MB 3792
Disk Busy% KBPS TPS KB-Read KB-Writ Steals 0 % Comp 67.0
hdisk1 0.0 0.0 0.0 0.0 0.0 PgspIn 0 % Noncomp 27.0
hdisk0 0.0 0.0 0.0 0.0 0.0 PgspOut 0 % Client 27.3
cd0 0.0 0.0 0.0 0.0 0.0 PageIn 0
PageOut 0 PAGING SPACE
Name PID CPU% PgSp Owner Sios 0 Size,MB 4096
java 352256 14.2 989.0 root % Used 0.7
topas 356596 0.2 1.2 root NFS (calls/sec) % Free 99.2
gil 65568 0.1 0.1 root ServerV2 0
java 344302 0.0 279.1 root ClientV2 0 Press:
xmgc 45078 0.0 0.0 root ServerV3 0 "h" for help
sendmail 180336 0.0 0.9 root ClientV3 0 "q" to quit
rpc.lock 250018 0.0 0.2 root
snmpdv3n 209058 0.0 1.0 root
netm 61470 0.0 0.0 root
java 340088 0.0 605.4 root
syncd 90190 0.0 0.5 root
dtwm 295060 0.0 1.8 root
X 110726 0.0 2.6 root
dtsessio 94306 0.0 1.8 root
IBM.CSMA 315558 0.0 2.2 root
ttsessio 131186 0.0 1.0 root
init 1 0.0 0.7 root
rgsr 176254 0.0 0.0 root
j2pg 106554 0.0 0.3 root
pilegc 40980 0.0 0.2 root
n4bg 192610 0.0 0.0 root
dtlogin 118924 0.0 0.5 root
dtterm 323616 0.0 1.3 root
cron 229556 0.0 0.5 root
|
Idle
项小于50%系统就很繁忙了
Network
中的各项值比较大时表示系统IO繁忙
Disk中Busy%值比较大表示服务器硬盘忙,
如果以上几项异常持续时间比较长就需要联系朗新公司分析一下原因
1.4.1.3 Weblogic server状态检查
登陆weblogic控制平台
http://
管理服务ip地址:端口/console
1
、查看servers项检查各weblogic server实例状态是否正常,正常为running,有异常联系朗新公司处理

2
、查看weblogic sever实例实时状态
查看Idle Threads:项,表示空闲的线程数,如果为0说明该实例已经没有空闲的线程
查看Queue Length:项,表示该实例的线程队列长度,大于0为异常
查看Memory Usage: 项,表示java 虚拟机内存的使用情况,正常为锯齿状

3
、查看数据库连接池状态
点击测试按钮,提示
Connection successful on: MyServer1
为正常,异常请联系朗新公司

1.4.2.1 数据库是否正常运行
方法一:监听是否正常运行
例如:
jlsyxora:/oracle$lsnrctl status
LSNRCTL for IBM/AIX RISC System/6000: Version 9.2.0.7.0 - Production on 31-OCT-2006 09:19:50
Copyright (c) 1991, 2002, Oracle Corporation. All rights reserved.
Connecting to (DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=jlsyxora)(PORT=1521)))
STATUS of the LISTENER
------------------------
Alias LISTENER
Version TNSLSNR for IBM/AIX RISC System/6000: Version 9.2.0.7.0 - Production
Start Date 13-OCT-2006 12:14:07
Uptime 17 days 21 hr. 5 min. 43 sec
Trace Level off
Security OFF
SNMP OFF
Listener Parameter File /oracle/product/db/9.2/network/admin/listener.ora
Listener Log File /oracle/product/db/9.2/network/log/listener.log
Listening Endpoints Summary...
(DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=loopback)(PORT=1521)))
Services Summary...
Service "PLSExtProc" has 1 instance(s).
Instance "PLSExtProc", status UNKNOWN, has 1 handler(s) for this service...
Service "jlsdlyx" has 2 instance(s).
Instance "jlsdlyx", status UNKNOWN, has 1 handler(s) for this service...
Instance "jlsdlyx", status READY, has 1 handler(s) for this service...
Service "jlsdlyxXDB" has 1 instance(s).
Instance "jlsdlyx", status READY, has 1 handler(s) for this service...
The command completed successfully
|