Oracle在Solaris下的性能与调整简介 (2) 3. 寻找性能瓶颈 一旦你已经定义了需要解决的性能问题,下一步骤就是缩小范围到瓶颈产生的地方。 这个阶段有必要问这样一些问题: 应用程序能告诉我它看到哪些是瓶颈?拿Oracle作例子,一个Oracle数据库管理员应该知道BSTAT/ESTATS是什么以及如何运行和理解它们。还是那句话,从应用程序的角度来看问题,BSTATS/ESTATS可以显示限制了Oralce性能的瓶颈,这可以作为进一步分析的指导。 大部分的时间花在哪里,是内核还是用户进程?通过vmstat、mpstat、sar、ps、prstat可以回答这个问题。 具有相近类型的所有资源是否同样繁忙?这个问题的意义在于寻找资源的不平等分布。比如,一个磁盘可能是瓶颈所在,或者一个CPU会比其他CPU更忙。对CPU,看mpstat。对磁盘,用iostat。 哪个或哪些进程在使用最多的资源?用这些命令可以看到使用CPU和内存最多的进程: ps -eo pid,pcpu,args | sort +1n CPU百分比: ps -eo pid,vsz,args | sort +1n K字节的虚拟内存: /usr/ucb/ps aux |more 输出被排序,使用CPU和内存最多的进程排在上面。 Solaris 8操作环境提供了prstat,它给出CPU和内存使用情况的一个动态注解。prstat -cvm的输出结果非常有用。 我们现在来看看怎用使常见的Solaris命令来开始性能分析。 vmstat命令是简单的。这里我们可以看到一个对于正在执行的应用程序,CPU能力不足的例子。 % vmstat 15 procs memory page disk faults cpu r b w swap free re mf pi po fr de sr m0 m1 m2 m3 in sy cs us sy id 45 0 0 2887216 182104 3 707 449 6 455 0 80 2 6 1 0 1531 5797 983 61 30 9 58 0 0 2831312 46408 5 983 582 56 3211 0 492 0 0 0 0 1413 4797 1027 69 31 0 55 0 0 2830944 56064 2 649 656 3 806 0 121 0 0 0 0 1441 4627 989 69 31 0 57 0 0 2827704 48760 4 818 723 6 800 0 121 0 0 1 0 1606 4316 1160 66 34 0 56 0 0 2824712 47512 6 857 604 56 1736 0 261 0 0 1 0 1584 4939 1086 68 32 0 58 0 0 2813400 47056 7 856 673 33 2374 0 355 0 0 0 0 1676 5112 1114 70 30 0 60 1 0 2816712 49464 7 861 720 6 731 0 110 7 0 3 0 2329 6131 1067 64 36 0 58 0 0 2817552 48392 4 585 521 0 996 0 146 0 0 0 0 1357 6724 1059 71 29 0 vmstat输出的第一行总是可以忽略。在"procs"下面标着"r"的一列是等待获得CPU的进程运行队列中的进程数。"id"列是CPU空闲时间。这台机器没有足够的CPU资源以满足进程运行的需要,这可以从它的大部分CPU时间花在用户空间里看出来(看"us"列)。 这里有两种办法可供采用——第一,增加更多的CPU,或者第二,对应用程序的代码作性能分析看看是不是应用程序的某部分可以优化。对代码片断作优化可能会需要非常大量的努力——而且有时候收到的效果很少。在关系到时间的时候,最好在考虑你可能的“投资回报”时现实一点。