在本文中,我将与您分享使用免费的lpar2rrd工具的一些好处。 使用了几年之后,我开始依靠它作为基于IBM Power的系统上共享处理器池的出色监视和报告工具。 我将简要描述lpar2rrd工具,并说明如何实现它来监视四个Power6系统上的共享处理器池。
我喜欢这个工具,因为它可以让我快速查看和报告多个系统上共享处理器池的使用情况。 自从大约3年前我开始使用它以来,我一直在努力传播有关这个惊人工具的信息。 我向愿意聆听的任何人提及它,令我惊讶的是,有多少人不知道该工具及其功能。
我希望本文能鼓励其他人在自己的环境中接受它。 也许有一天,它可能会像nmon实用程序一样由IBM正式支持。 一个人只能希望。
lpar2rrd概述
lpar2rrd工具已经使用了好几年(可追溯到2006年)。 当我第一次查看它时,我喜欢它所承诺的想法,例如监视和报告共享处理器池。 但是,该工具仍处于起步阶段,我在启动和运行时遇到了一些问题。 当我在12个月后查看它时,情况肯定发生了变化。 它有了很大的改进,我能够很快(大约30分钟)启动并运行该工具。
我对它所能提供的信息感到惊讶。 当我考虑以前如何在共享处理器池上进行监视和报告时,这真是新鲜空气。
我们要感谢捷克共和国的IBM员工Pavel Hampl所做的这项出色的项目。 他是该工具的创造者,他在将其全部拉出并继续开发和改进该实用工具方面做得非常出色。
lpar2rrd工具能够为共享处理器分区和系统收集历史CPU利用率数据。 它旨在与带有共享处理器池的HMC连接的微分区系统一起使用。 它是无代理的,因此无需在每个LPAR上安装代理。
使用数据是从HMC收集的(通过lslparutil )。 lpar2rrd实用程序通过SSH连接到指定的HMC,以收集性能数据。 此数据存储在lpar2rrd系统上的RRD数据库中。 处理数据并为每个LPAR和共享处理器池的共享处理器使用情况生成图表。
然后可以通过在lpar2rrd服务器系统上运行的Web服务器(HTTP)访问这些图形。 这是一个非常简单的架构,lpar2rrd网站的下图(图1)对此进行了详细说明。
图1. lpar2rrd架构概述

数据定期收集(您可以决定)。 历史数据可用,并且可以为您提供LPAR或整个系统的绝佳视图,以及几天,几个月或几年内共享的处理器使用情况。
准备安装该工具时,建议您访问lpar2rrd网站 ,下载最新版本的代码,然后按照详细的安装说明进行操作。
确保您已提名将充当lpar2rrd服务器的系统,并且已安装所有必备组件。 另外,请确保您在此系统上具有正常运行的Web服务器。 安装说明将引导您完成“ lpar2rrd to HMC” SSH通信设置。
lpar2rrd服务器可以托管在任何UNIX类型的系统上,因为所需要的只是SSH,Web服务器,Perl和RRDTool。 对我来说,将lpar2rrd托管在我的AIX LPAR之一上,尤其是在我的NIM服务器之一上是有意义的。
从1.83版开始,我一直使用lpar2rrd,而最近,我升级到了2.51版。 版本2具有许多新功能,例如支持多个共享处理器池 ,更不用说改进的Web前端。 从1.83升级到2.51毫不费力。 Pavel的文档提供了执行更新的简单说明。
最新版本2.59(截至2010年2月26日)现在支持LEA / HEA网络统计信息,IVM支持以及LPAR /池使用情况图表的实时刷新。 而且根据Wiki,未来还有计划支持Power等最新技术,例如Active Memory Sharing 。
除了CPU统计信息外,该工具还可以提供与内存分配,LPAR配置和状态更改历史记录有关的数据。
IBM并不正式支持此工具。 但是,如果lpar2rrd确实有问题,可以通过电子邮件联系其创建者并寻求帮助。 例如,如果您查看lpar2rrd网站上的发行说明,则会发现以下条目:
1.85 (16-May-2008)
fixed a problem with LANG variable on HMC set to other than en_US with date format
different from MM/DD/YYYY
那是我! 我在使用该工具时遇到了问题,并与Pavel联系。 他对我的问题的解决做出了非常Swift的React,然后开始使用永久性修复程序更新lpar2rrd。 请记住,这是一个仅在“空闲时间”内进行的项目,并非由IBM赞助。 因此,请不要使用电子邮件的请求支持来淹没开发人员!
使用lpar2rrd
在我的环境中,我们有四个需要监视的IBM POWER6共享处理器池。 我们有一个p6 570(9117-MMA)和三个p6 595(9119-FHA)。 每个系统都有一个共享处理器池。 我们使用lpar2rrd工具收集每个帧的使用情况数据,然后使用生成的图形报告处理器池的总体使用情况。 我们还使用它来监视和报告各个LPAR(共享)处理器的使用情况。
在图2中,lpar2rrd从两个HMC收集利用率数据。 我们在一个连接到570-1、595-1和595-2的站点上拥有一个HMC(hhmc01)。 另一个HMC(bhmc01)连接到位于灾难恢复站点上的595-3。
图2.客户的POWER6环境

为了让您了解我们如何使用lpar2rrd及其带来的好处,我提供了一些屏幕截图。
lpar2rrd代码安装在570-1上的一个NIM主设备(hxnim1)上。 NIM主服务器上也安装了Apache。 要访问该工具,只需将Web浏览器指向URL http:// hxnim1 / lpar2rrd。
lpar2rrd主页提供了两个HMC的链接(图3)。
图3. – lpar2rrd主页
选择HMC(在本例中为hhmc01)之后,将看到我的一个受管系统570-1(图4)的一些处理器池数据。 该页面显示最后一天,一周,一个月和一年中570-1的共享处理器池使用情况。
图4. 570-1的共享处理器池使用率
在左侧的MANAGED SYSTEMS ( 管理的系统)下 ,列出了与此HMC连接的每个电源系统。 如果要查看其他框架,只需单击受管系统名称。 或者,如果我想看看不同的管理系统,在另一HMC,我只需点击HMC名称,HMC下(S),选择所需的管理系统的名称。
要查看单个LPAR的使用情况数据,我可以在左侧的LPAR(列表)列表中选择LPAR名称。 显示最后一天,一周和一年中LPAR的共享CPU使用情况数据。 图5就是一个例子。
图5. 595-1上LPAR的共享处理器使用率
lpar2rrd的另一个重要功能是聚合的LPAR视图。 这样一来,您可以查看一帧中的所有LPAR,以及每个LPAR消耗了多少处理器(请参见下面的图6)。
图6. 595-1上所有LPAR的聚合LPAR视图
每个HMC视图的Total CPU util也很有趣。 您可以快速观察到连接到HMC的受管系统使用的处理器最多。 它可以帮助您确定可以将LPAR移至何处以平衡工作量。 例如,您可以参考图7。
图7.每个HMC视图的总CPU利用率
如果要在特定受管系统上查找LPAR,则还可以使用搜索功能。 在“ LPAR搜索”下 ,只需输入LPAR的名称,单击“搜索”,您将看到该系统数据的链接。 注意:我发现在向搜索框中输入数据时必须勾选区分大小写 ,否则搜索不会返回任何内容。 对于屏幕截图示例,您可以参考下面的图8和9。
图8. LPAR搜索框
图9. LPAR搜索结果

也可以根据您自己的日期和时间标准生成历史报告。 不要忘记选择正确的HMC采样率 ,否则您将看不到任何匹配的数据! 例如,在图10中 ,我选择了hvio3。 结果如图11所示 ,显示了从2009年12月15 日午夜到2009年12月16 日午夜hvio3的共享处理器使用情况。注意:页面右侧还有一个方便的Export to CSV链接。
图10.生成595-1上的LPAR的历史报告
图11. 595-1上的LPAR的历史CPU使用率图

要在HMC上收集利用率数据,必须为每个受管系统启用数据收集(图12)。 这是通过HMC执行的,并在lpar2rrd设置指南中进行了介绍。
图12.通过HMC启用利用率数据的捕获
您还可以自定义收集数据的采样率(图13)。 在2.01版之前,默认设置为一小时。 现在可以将其更改为小于此值,具体取决于您的需要(可能的采样率是30s,60s,300s,1800s和3600s)。
图13.通过HMC更改采样率

lpar2rrd环境和数据
为了让您了解典型的lpar2rrd安装及其数据文件的外观,我在下面提供了一些输出。 在按照lpar2rrd网站上概述的安装和配置步骤进行操作之后,几乎没有什么可做的了。 我很少需要管理底层的lpar2rrd环境,但是了解一些“幕后知识”总是有帮助的。
该环境位于我的NIM服务器(hxnim1)上的lpar2rrd用户主目录下的目录中(例如/home/lpar2rrd/lpar2rrd
)。
lpar2rrd@hxnim1 /home/lpar2rrd $ ls -ltr
total 400
drwxr-xr-x 4 lpar2rrd staff 4096 Feb 11 2007 lpar2rrd
hxnim1上的lpar2rrd用户无需密码即可直接SSH到我的两个HMC。
lpar2rrd@hxnim1 /home/lpar2rrd/.ssh $ ssh hhmc01 date
Wed Nov 25 09:36:32 EST 2009
lpar2rrd@hxnim1 /home/lpar2rrd/.ssh $ ssh bhmc01 date
Wed Nov 25 10:08:40 EST 2009
我为load.sh
脚本创建了一个新的cron作业。 它会每小时运行一次,以与我在HMC上的一小时采样率相对应。
lpar2rrd@hxnim1 /home/lpar2rrd/lpar2rrd $ crontab -l
05 * * * * /home/lpar2rrd/lpar2rrd/load.sh > /home/lpar2rrd/lpar2rrd/rrdload.err 2>&1
我自定义了lpar2rrd配置文件(作为安装说明的一部分)以适合我的环境。 我在下面突出显示了我更改的变量。
# Directory where the tool is installed
INPUTDIR=/home/lpar2rrd/lpar2rrd
# WWW directory where the tool places graphs, directory must exist before the first run,
# make sure that rights are correct
#WEBDIR=/home/apache/html/lpar2rrd
WEBDIR=/opt/freeware/apache/share/htdocs/lpar2rrd
# user for download data from HMC, it must exist on HMC and must have allowed access
# via ssh-keys
HMC_USER=lpar2rrd
# HMC hostname (you can specify list of hostnames separated by a space)
HMC_HOSTAME="hhmc01 bhmc01"
当我第一次运行load.sh
脚本时,从两个HMC收集了所有受管系统的数据。
Working for managed name : SN1001C70_p570-1Load data for hhmc01Load hourly stats
fetching hhmc01:SN1001C70_p570-1 lpar data
fetching hhmc01:SN1001C70_p570-1 pool data
fetching hhmc01:SN1001C70_p570-1 mem data
updating rrd db : hhmc01:data : /home/lpar2rrd/lpar2rrd/data/
SN1001C70_p570-1/hhmc01/in-h
updating rrd db : hhmc01:mem : /home/lpar2rrd/lpar2rrd/data/
SN1001C70_p570-1/hhmc01/mem.in-h
updating rrd db : hhmc01:pool : /home/lpar2rrd/lpar2rrd/data/
SN1001C70_p570-1/hhmc01/pool.in-h
Drawing charts for : hvio1
Create graphs for hhmc01:SN1001C70_p570-1:hvio1:d
...
creating html pages for LPAR: hxaix66
creating html pages for LPAR: hxaix68adm
creating html pages for LPAR: hxaix69
creating html pages for LPAR: hxaix70
creating html pages for LPAR: hxaix71adm
creating html pages for LPAR: hxaix97
creating html pages for LPAR: hxnim3
每个系统的数据都存储在lpar2rrd数据目录中。 值得注意的是,它仅需要很少的磁盘空间,具体取决于采样率,受管系统和LPAR的数量。 下面的du
输出来自已经运行了几年的lpar2rrd安装。 大约100个LPAR的数据量只有160MB左右,采样率为一小时。
lpar2rrd@hxnim1 /home/lpar2rrd/lpar2rrd/data $ ls -ltr
total 0
drwxr-xr-x 3 lpar2rrd staff 256 May 16 2008 SN1001C70_p570-1
drwxr-xr-x 3 lpar2rrd staff 256 Jan 20 2009 SN8379A60_p595-3
drwxr-xr-x 3 lpar2rrd staff 256 Jan 27 2009 SN8379A80_p595-2
drwxr-xr-x 3 lpar2rrd staff 256 Feb 11 2009 SN8379A70_p595-1
lpar2rrd@hxnim1 /home/lpar2rrd $ du -sm .
162.29 .
在系统的数据目录中,您将按预期找到每个LPAR的RRD数据文件(不出意外)。
lpar2rrd@hxnim1 /home/lpar2rrd/lpar2rrd/data/SN1001C70_p570-1 $ ls -ltr
total 8
drwxr-xr-x 2 lpar2rrd staff 4096 Sep 01 00:05 hhmc01
total 56320
-rw-r--r-- 1 lpar2rrd staff 434776 May 24 2008 hxaix21.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Sep 24 2008 hxaix05.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Sep 24 2008 hxaix03.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 24 2008 hxaix05.rrh
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 24 2008 hxaix03.rrh
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 pool.rrd
-rw-r--r-- 1 lpar2rrd staff 109120 Nov 25 00:05 mem.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxnim1.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix99.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix60.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix53.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix50.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix46.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix32.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix31.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix30.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix29.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix28.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix27.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix26.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix25.rrd
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 00:05 hxaix20.rrd
...
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 09:05 hxaix07.rrh
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 09:05 hxaix06.rrh
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 09:05 hxaix04.rrh
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 09:05 hxaix02.rrh
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 09:05 hxaix01.rrh
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 09:05 hvio2.rrh
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 09:05 hvio12.rrh
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 09:05 hvio11.rrh
-rw-r--r-- 1 lpar2rrd staff 434776 Nov 25 09:05 hvio1.rrh
-rw-r--r-- 1 lpar2rrd staff 59960 Nov 25 09:05 in-d
-rw-r--r-- 1 lpar2rrd staff 1560 Nov 25 09:05 pool.in-d
-rw-r--r-- 1 lpar2rrd staff 624 Nov 25 09:05 mem.in-d
好消息是,配置完成后,您无需真正担心任何其他问题! 另外,如果您想快速查看当前的lpar2rrd配置文件,可以通过Web界面进行。 只需在LPAR2RRD下选择Configuration ,就会显示lpar2rrd.cfg
文件(图14)。
图14. lpar2rrd配置文件
另外,如果您想查看在上次运行load.sh
脚本期间发生了什么错误(如果有),还可以从Web界面查看此错误(图15)。 在LPAR2RRD下 ,选择错误日志 。
图15. lpar2rrd错误日志
摘要
您可能会说,我是这个工具的忠实拥护者。 我试图证明为什么我相信lpar2rrd是监视和报告基于IBM Power的系统上共享处理器池使用情况的最佳免费工具。 我还没有碰到任何其他可以做lpar2rrd做得很好的工具(也许是Ganglia ,另一个出色的免费工具除外)。 我也没有遇到任何可以做得更好的产品(花费真钱)的实现。 Web前端看起来可能并不漂亮,但是此工具的简单性和功能使我们可以忽略任何外观上的缺点。 我强烈推荐lpar2rrd。
翻译自: https://www.ibm.com/developerworks/aix/library/au-lpar2rrd/index.html