使用zabbix监控磁盘是否只读

因环境中主机资源紧张,vm资源争抢严重,常出现文件系统只读情况。介绍了在zabbix - agent上的操作,需将模板在zabbix上导入(配置 - 模板 - 导入),还可在zabbix - server上先进行测试,并让主机链接新创建的模板。

由于环境上主机资源紧张,vm对资源争抢严重,导致时常会出现文件系统只读的情况。

  1. 在zabbix-agent上:
mkdir -p /usr/local/zabbix/scripts
cd /usr/local/zabbix/scripts
cat >> disk_health_check.py <<EOF
#!/usr/bin/python
# -*- coding: utf-8 -*-
#磁盘只读检测脚本正常0,异常1
import time
try:
    fileDisk = open ( '/usr/local/zabbix/scripts/disk_health_check.log', 'w' )
    old = str(time.time())
    fileDisk.write(old)
    fileDisk = open ( '/usr/local/zabbix/scripts/disk_health_check.log' )
    new=fileDisk.read()
    if (old==new):
        print '0'
    else:
        print '1'
    fileDisk.close()
except:
    print '1'
EOF
chmod +x disk_health_check.py
cd /etc/zabbix/zabbix_agentd.d/
echo "UserParameter=disk.health.check,/usr/bin/python /usr/local/zabbix/scripts/disk_health_check.py" > disk.conf
chown -R zabbix:zabbix /usr/local/zabbix/
sed -i "s/SELINUX=enforcing/SELINUX=disabled/g" /etc/sysconfig/selinux
sed -i "s/SELINUX=enforcing/SELINUX=disabled/g" /etc/selinux/config
setenforce 0
systemctl restart zabbix-agent


  1. 把下面的模板在zabbix上面导入(配置-模板-导入):
<?xml version="1.0" encoding="UTF-8"?>
<zabbix_export>
    <version>4.2</version>
    <date>2019-05-21T02:13:55Z</date>
    <groups>
        <group>
            <name>Template-Hardware</name>
        </group>
    </groups>
    <templates>
        <template>
            <template>DiskHealth-Check</template>
            <name>DiskHealth-Check</name>
            <description>磁盘写入输出状态0正常,1异常</description>
            <groups>
                <group>
                    <name>Template-Hardware</name>
                </group>
            </groups>
            <applications>
                <application>
                    <name>diskHealth</name>
                </application>
            </applications>
            <items>
                <item>
                    <name>文件系统read-only检查</name>
                    <type>0</type>
                    <snmp_community/>
                    <snmp_oid/>
                    <key>disk.health.check</key>
                    <delay>120</delay>
                    <history>90d</history>
                    <trends>365d</trends>
                    <status>0</status>
                    <value_type>3</value_type>
                    <allowed_hosts/>
                    <units/>
                    <snmpv3_contextname/>
                    <snmpv3_securityname/>
                    <snmpv3_securitylevel>0</snmpv3_securitylevel>
                    <snmpv3_authprotocol>0</snmpv3_authprotocol>
                    <snmpv3_authpassphrase/>
                    <snmpv3_privprotocol>0</snmpv3_privprotocol>
                    <snmpv3_privpassphrase/>
                    <params/>
                    <ipmi_sensor/>
                    <authtype>0</authtype>
                    <username/>
                    <password/>
                    <publickey/>
                    <privatekey/>
                    <port/>
                    <description/>
                    <inventory_link>0</inventory_link>
                    <applications>
                        <application>
                            <name>diskHealth</name>
                        </application>
                    </applications>
                    <valuemap/>
                    <logtimefmt/>
                    <preprocessing/>
                    <jmx_endpoint/>
                    <timeout>3s</timeout>
                    <url/>
                    <query_fields/>
                    <posts/>
                    <status_codes>200</status_codes>
                    <follow_redirects>1</follow_redirects>
                    <post_type>0</post_type>
                    <http_proxy/>
                    <headers/>
                    <retrieve_mode>0</retrieve_mode>
                    <request_method>0</request_method>
                    <output_format>0</output_format>
                    <allow_traps>0</allow_traps>
                    <ssl_cert_file/>
                    <ssl_key_file/>
                    <ssl_key_password/>
                    <verify_peer>0</verify_peer>
                    <verify_host>0</verify_host>
                    <master_item/>
                </item>
            </items>
            <discovery_rules/>
            <httptests/>
            <macros/>
            <templates/>
            <screens/>
            <tags/>
        </template>
    </templates>
    <triggers>
        <trigger>
            <expression>{DiskHealth-Check:disk.health.check.count(#2,1,&quot;eq&quot;)}&gt;1</expression>
            <recovery_mode>0</recovery_mode>
            <recovery_expression/>
            <name>文件系统read-only</name>
            <correlation_mode>0</correlation_mode>
            <correlation_tag/>
            <url/>
            <status>0</status>
            <priority>5</priority>
            <description>2次内触发器等于1的次数大于1(等于2)次就会告警,判断两次都异常即告警</description>
            <type>0</type>
            <manual_close>0</manual_close>
            <dependencies/>
            <tags/>
        </trigger>
    </triggers>
    <graphs>
        <graph>
            <name>文件系统read-only检查</name>
            <width>900</width>
            <height>200</height>
            <yaxismin>0.0000</yaxismin>
            <yaxismax>100.0000</yaxismax>
            <show_work_period>1</show_work_period>
            <show_triggers>1</show_triggers>
            <type>0</type>
            <show_legend>1</show_legend>
            <show_3d>0</show_3d>
            <percent_left>0.0000</percent_left>
            <percent_right>0.0000</percent_right>
            <ymin_type_1>0</ymin_type_1>
            <ymax_type_1>0</ymax_type_1>
            <ymin_item_1>0</ymin_item_1>
            <ymax_item_1>0</ymax_item_1>
            <graph_items>
                <graph_item>
                    <sortorder>0</sortorder>
                    <drawtype>3</drawtype>
                    <color>00C800</color>
                    <yaxisside>0</yaxisside>
                    <calc_fnc>7</calc_fnc>
                    <type>0</type>
                    <item>
                        <host>DiskHealth-Check</host>
                        <key>disk.health.check</key>
                    </item>
                </graph_item>
            </graph_items>
        </graph>
    </graphs>
</zabbix_export>


  1. 可以在zabbix-server上先测试一下:
[root@0f3c27f24c08 alertscripts]# zabbix_get -s 172.16.6.24 -k disk.health.check
0
  1. 主机链接新创建的模板
### Zabbix 实时监控机房服务器的配置方法 为了实现实时监控机房服务器的硬件和系统状态,Zabbix 提供了多种监控方式和工具。以下是一个详细的配置步骤,涵盖硬件监控、系统状态监控以及通过 iLO 进行远程监控的配置。 #### 1. 配置 Zabbix Agent 监控 Linux/Windows 系统状态 Zabbix Agent 是部署在被监控主机上的客户端程序,用于收集本地资源和应用程序的数据。 **步骤:** - **安装 Zabbix Agent:** 在目标服务器上安装 Zabbix Agent,可以通过官方仓库安装: ```bash # Ubuntu/Debian sudo apt-get install zabbix-agent # CentOS/RHEL sudo yum install zabbix-agent ``` - **配置 Zabbix Agent:** 编辑 `/etc/zabbix/zabbix_agentd.conf` 文件,设置 Zabbix Server 的 IP 地址: ```ini Server=ZABBIX_SERVER_IP ServerActive=ZABBIX_SERVER_IP Hostname=ZABBIX_AGENT_HOSTNAME ``` - **启动并启用服务:** ```bash sudo systemctl start zabbix-agent sudo systemctl enable zabbix-agent ``` - **在 Zabbix Web 界面中添加主机:** 登录 Zabbix Web 界面,添加主机并选择 `Linux by Zabbix agent` 或 `Windows by Zabbix agent` 模板,即可监控 CPU、内存、磁盘 I/O、网络等系统资源。 #### 2. 配置 Zabbix Proxy 以减轻 Zabbix Server 负载 当监控的服务器数量较多时,建议使用 Zabbix Proxy 来分担 Zabbix Server 的压力。Zabbix Proxy 可以作为中间节点,代理收集 Agent 的数据并转发给 Zabbix Server [^1]。 **步骤:** - **安装 Zabbix Proxy:** 安装与 Zabbix Server 相同版本的 Zabbix Proxy,并配置数据库(如 MySQL、PostgreSQL)。 - **配置 Zabbix Proxy:** 编辑 `/etc/zabbix/zabbix_proxy.conf`,设置 `Server` 和 `Hostname`: ```ini Server=ZABBIX_SERVER_IP Hostname=ZABBIX_PROXY_NAME ``` - **配置数据库连接:** 设置 `DBName`、`DBUser` 和 `DBPassword` 以连接数据库。 - **启动服务:** ```bash sudo systemctl start zabbix-proxy sudo systemctl enable zabbix-proxy ``` - **在 Zabbix Web 中配置 Proxy:** 在 Zabbix Web 界面中创建 Proxy,并将其分配给需要监控的主机。 #### 3. 使用 iLO 实现 HP 服务器的硬件监控 对于 HP 服务器,可以通过 iLO(Integrated Lights-Out)接口实现硬件级别的监控,包括温度、风扇状态、电源状态等 [^3]。 **步骤:** - **配置 iLO 访问权限:** 登录 HP 服务器的 iLO 管理界面,添加用户并设置权限,确保 Zabbix 可以访问 iLO 的 API。 - **使用 Zabbix SNMP 监控 iLO:** 在 Zabbix Web 界面中添加主机,选择 `SNMP` 接口类型,配置 SNMP 社区字符串为 iLO 的只读社区名(如 `public`)。 - **配置 SNMP 监控项:** 使用 SNMP OID 来获取硬件信息,例如: - 温度传感器:`.1.3.6.1.4.1.232.6.2.1.1.6` - 风扇状态:`.1.3.6.1.4.1.232.6.2.1.1.4` - 电源状态:`.1.3.6.1.4.1.232.6.2.1.1.5` - **设置触发器和告警:** 当温度超过阈值或风扇故障时,触发告警并通知相关人员。 #### 4. 使用 Zabbix Sender 和 Zabbix Get 实现主动和被动监控 Zabbix 提供了 `zabbix_get` 和 `zabbix_sender` 工具,分别用于主动拉取和被动推送数据。 - **zabbix_get:** 用于从 Zabbix Agent 主动获取数据,命令如下: ```bash zabbix_get -s AGENT_IP -k system.uname ``` - **zabbix_sender:** 用于将自定义脚本的结果推送到 Zabbix Server: ```bash echo -e "host1\tkey\tvalue" | zabbix_sender -z ZABBIX_SERVER_IP -i - ``` #### 5. 配置自定义监控项和脚本 可以编写脚本监控特定的硬件或系统指标,并通过 Zabbix Agent 或 Zabbix Sender 上报。 **示例:监控磁盘使用率** 创建脚本 `/usr/local/bin/check_disk.sh`: ```bash #!/bin/bash df -h | awk '$5 > 90 {print $0}' ``` 在 Zabbix Agent 配置中添加: ```ini UserParameter=custom.disk.warning,/usr/local/bin/check_disk.sh ``` 在 Zabbix Web 中添加监控项,使用 `custom.disk.warning` 键值,并设置触发器当输出非空时触发告警。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值