Hadoop 集群监控与管理:Nagios 与 Ambari 的实践应用
1. Nagios 监控系统配置与使用
Nagios 是一款强大的集群监控工具,可用于监控 Hadoop 集群资源。以下是配置和使用 Nagios 的详细步骤:
1.1 配置 nrpe
在文件中找到 allowed_hosts 行,并更改服务器名称,以指定允许与 nrpe 通信的服务器。示例如下:
allowed_hosts=hc1nn
同时,在每个 nrpe.cfg 文件中添加以下命令行,定义用于监控每个服务器的服务命令,具体包括对用户、负载、磁盘( / 和 /home )以及进程的检查:
command[check_users]=/usr/lib/nagios/plugins/check_users -w 5 -c 10
command[check_load]=/usr/lib/nagios/plugins/check_load -w 15,10,5 -c 30,25,20
command[check_root]=/usr/lib64/nagios/plugins/check_disk -w 20% -c 10% -p /
command[check_home]=/usr/lib64/nagios/plugins/check_disk -w 20% -c 10% -p /
超级会员免费看
订阅专栏 解锁全文
735

被折叠的 条评论
为什么被折叠?



