1 Linux监控平台介绍
2 zabbix监控介绍
3 安装zabbix
4 忘记Admin密码如何做
5 主动模式和被动模式
6 添加监控主机
7 添加自定义模板
8 处理图形中的乱码
9 自动发现
10 添加自定义监控项目
11 配置邮件告警
12 测试告警
13 不发邮件的问题处理
1.Linux监控平台介绍
常见开源监控软件
- cacti、nagios、zabbix、smokeping、open-falcon等等,其中nagios、zabbix流行度高
- cacti、smokeping偏向于基础监控,成图非常漂亮,适合监控网络设备
- cacti、nagios、zabbix服务端监控中心,需要php环境支持(用Apache的php,用nginx的php都可以),其中zabbix和cacti都需要mysql作为数据存储,nagios不用存储历史数据,注重服务或者监控项的状态,zabbix会获取服务或者监控项目的数据,会把数据记录到数据库里,从而可以成图
- open-falcon为小米公司开发,开源后受到诸多大公司和运维工程师的追捧,适合大企业,滴滴、360、新浪微博、京东等大公司在使用这款监控软件,值得研究
- 后续以介绍zabbix为主
2.zabbix监控介绍
- C/S架构,基于C++开发,监控中心支持web界面配置和管理
- 单台server节点(即一台server),理论上 可以支持上万台客户端
- 目前zabbix软件,最新版本3.4,官方文档:https://www.zabbix.com/manuals
- 5个组件
- zabbix-server 监控中心,接收客户端上报信息,负责配置、统计、操作数据
- 数据存储 存放数据,比如mysql
- web界面 也叫web UI,在web界面下操作配置是zabbix简单易用的主要原因(如果没有web界面,就无法在浏览器上配置它)
- zabbix-proxy 可选组件,它可以代替zabbix-server的功能,减轻server的压力(当机器量很多的时候,可以使用zabbix-proxy)
- zabbix-agent 客户端软件(每一台客户端都需要安装agent),负责采集各个监控服务或项目的数据,并上报
3.安装zabbix
- 官网下载地址https://www.zabbix.com/download
- wget repo.zabbix.com/zabbix/3.2/rhel/7/x86_64/zabbix-release-3.2-1.el7.noarch.rpm
- rpm -ivh zabbix-release-3.2-1.el7.noarch.rpm
- yum install -y zabbix-agent zabbix-get zabbix-server-mysql zabbix-web zabbix-web-mysql
- 会连带安装httpd和php
- 如果mysql之前没有安装的话,需要根据lamp那一章的mysql安装方法安装mysql
- vim /etc/my.cnf //需要增加配置
character_set_server = utf8
- 重启mysqld服务后,进入mysql命令行,创建zabbix库
- create database zabbix character set utf8;
- 再创建用户
- grant all on zabbix.* to 'zabbix'@'127.0.0.1' identified by 'aming-zabbix';
- 导入数据
- cd /usr/share/doc/zabbix-server-mysql-3.2.7
- gzip -d create.sql.gz
- mysql -uroot -pxxx zabbix < create.sql
- systemctl start httpd; systemctl enable httpd
- vim /etc/zabbix/zabbix_server.conf //修改或增加
DBHost=127.0.0.1 //在DBName=zabbix上面增加
DBPassword=aming-zabbix //在DBuser下面增加
- systemctl start zabbix-server
- systemctl enable zabbix-server
- netstat -lntp |grep zabbix //查看监听端口
- 浏览器访问http://ip/zabbix/ web界面下面配置zabbix
- 用户名Admin 密码zabbix
- 进入后台第一件事情就是修改密码
准备工作
两台机器,一台作为服务端(监控中心),另外一台作为它的客户端,均安装zabbix。
首先访问官网下载地址,选择zabbix3.2版本centOS7 64位,点击download,找到如下rpm包,复制链接
两台机器上都下载rpm包
安装rpm包
安装zabbix服务端
查看/etc/yum.repos.d/目录,有zabbix.repo
安装zabbix一些包
- zabbix-agent ,客户端软件
- zabbix-get ,服务端用的一个工具,获得客户端某些监控项目的数据
- zabbix-server-mysql ,这个是服务端跟mysql打交道相关的组件
- zabbix-web ,web界面
- zabbix-web-mysql ,web和mysql相关组件
安装mysql,根据lamp那一章的mysql安装方法安装mysql,也可以yum安装
启动mysql服务
编辑mysql的配置文件,增加内容如下,保存退出
重启mysql
登录mysql,创建zabbix库,创建用户,退出
解压create.sql.gz压缩包
将create.sql文件导入到zabbix库里去
启动zabbix服务
查看nginx服务是否启动,若有先关掉,然后启动httpd服务
httpd服务监听了80端口
对zabbix、http等服务设置开机启动,取消nginx开机启动
查看监听端口,但并没有zabbix监听的端口
先检查zabbix的错误日志
编辑zabbix的配置文件,搜索DBHost,增加内容如下,保存退出
重新启动zabbix服务
查看监听的端口
配置web界面
打开浏览器,输入192.168.133.130访问
点击 Next step,会出现一个提示
编辑php的配置文件,搜索/timezone,设置php的timezone时区
重启httpd服务
刷新浏览器界面,变成OK了,继续点击Next step
配置数据库相关信息,点击Next step
定义zabbix server主机名,点击Next step
继续点Next step
安装成功
登录zabbix
登录进zabbix之后,首先需要去更改密码,选择 Administration ,然后选择 Users,选择 Change password 修改密码和选择语言(支持中文),点击update即可
刷新一下,界面变成中文了
退出去,然后用新密码登录,就进入zabbix的web界面了
安装zabbix客户端
下载和安装yum源,只需要安装zabbix-agent这一个包
编辑zabbix配置文件,搜索/server,修改指定服务端IP,搜索/Hostname,修改成可识别的主机名,保存退出
启动zabbix服务,查看进程和监听端口
zabbix监控架构搭建完成。
4.忘记Admin密码如何做
- 进入mysql命令行,选择zabbix库
- mysql -uroot -p zabbix
- update users set passwd=md5(‘newpasswd’) where alias=‘Admin’;
- 这样就更改了Admin用户的密码
如果忘记zabbix(web界面)管理员密码,可通过zabbix服务器的数据库进行密码更改!
先进入到mysql命令行,选择zabbix库
查看users表
修改密码,查看表的情况
设置完成后在浏览器就可以使用新密码登录zabbix
5.主动模式和被动模式
-
主动或者被动是相对客户端来讲的
-
被动模式,服务端会主动连接客户端获取监控项目数据,客户端被动地接受连接,并把监控信息传递给服务端
-
主动模式,客户端会主动把监控数据汇报给服务端,服务端只负责接收即可
-
当客户端数量非常多时,建议使用主动模式,这样可以降低服务端的压力。
-
服务端有公网ip,客户端只有内网ip,但却能连外网,这种场景适合主动模式
6.添加监控主机
- 先添加主机组aming-test
- 再添加主机,主机名称和可见名称都写aming-02
- 群组选择aming_test
- IP地址填写客户端的ip 192.168.133.132
- 几个概念:应用集、监控项、触发器、图形、自动发现、web监测
登录到web界面添加监控主机,选择配置,主机群组 ,创建主机群组,输入组名,点击添加
然后在选择主机,创建主机,输入信息如下,点击添加
添加完主机后看到有应用集、监控项、触发器、图形、自动发现、web监测;在监控项里定义主动和被动模式
应用集:应用集就是监控项的集合
监控项:所有的监控项目
触发器:就是针对某一个项目,设置的一个告警规则
图形:根据监控历史数据绘制的图表
自动发现规则:zabbix自动监控的文件系统的信息、网卡信息
web场景:用于监控某个web站点
7.添加自定义模板
- 可以自定义一个常用模板,方便给新增主机添加监控项目
- 自定义aming模板
- 把其他自带模板里面的某些监控项目(比如cpu、内存等)复制到aming模板里
- 定义触发器
- 添加图形
- 自动发现,找到Template OS Linux,点击右侧的自动发现,参考Mounted filesystem discovery和Network interface discovery定义规则
- 可以直接导出、导入模板,然后再删除不需要的对象
在配置中的选择模板,创建模板,填入模板信息如下,点击添加
刚添加的模板,应用集、监控项、触发器、自动发现规则、web场景都为空的,我们可以自带的模板里面找内容添加,比如在Template OS Linux 模板里面找一些监控项,选择好复制到我的模板里去。触发器、图形、聚合图形、web监测都可以使用这种方法添加内容,但是自动发现这一项不可以使用这种方法添加内容。
另外一种方法(推荐),需要将之前复制的内容删除,然后点击模板进去,选择链接的模板,选择Template OS Linux,点击添加,点击更新
更新之后,会看到模板里面有了应用集、监控项、图形、自动发现等;
如果监控项我们有一些不需要的内容,我们无法直接删除监控项目,因为是该项目下所有规则都是链接到template os Linux中的,需要在链接模板选项下设置
- 取消链接,仅仅只会把链接取消,但并不会把应用集、监控项等给清空掉
- 取消链接并清理,就会把里面的所有给清空
点取消链接,然后更新,会看到模板里面依旧存在监控项、应用集等,不同的是它们前面没有链接模板的名字,这时候可以删除内容了。
说明:应用集中包含了所有的监控项,所以只有先删除监控项之后才能删除应用集;删除应用集时,只要右侧监控项有数字的都得留着,没有数字的监控项都可以删除。
8.处理图形中的乱码
- 设置为中文后,zabbix图形的中文文字会显示小方框
- 这是因为在zabbix的字体库中没有中文字体,需要从windows上借用一个过来
- vim /usr/share/zabbix/include/defines.inc.php //搜索ZBX_FONTPATH -它定义的路径是“fonts”,它是一个相对路径,绝对路径为/usr/share/zabbix/fonts,而字体文件为“ZBX_GRAPH_FONT_NAME”所定义的“graphfont”,它是一个文件,绝对路径为/usr/share/zabbix/fonts/graphfont
- windows字体路径为“C:\Windows\Fonts\”,找到“simfang.ttf”(其实就是那个仿宋简体),先把它复制到桌面上,然后上传到linux的/usr/share/zabbix/fonts/,并且改名为graphfont.ttf
首先把aming模板连接到aming-02这个主机上去
点击更新之后,出现如下界面
然后点击图形,选择CPU load,选择预览,出现小方框,意味着乱码。一般乱码常见的原因原因是字符集不对,但这里不是,而是缺少中文的字库。
在服务端上打开配置文件/usr/share/zabbix/include/defines.inc.php,搜索/ZBX_GRAPH_FONT_NAME
fonts是一个相对路径,绝对路径为/usr/share/zabbix/fonts
图形界面显示乱码是因为该字库不支持中文字体,解决办法是将该字库软链接到一个支持中文的字库下。
在Windows中,打开计算机,选中C盘,Windows,Fonts,选择简体字(隶书常规)复制到桌面上;然后回到虚拟机,使用xftp上传(ctrl+alt+F),选中双击放到root下
将该文件移动到/usr/share/zabbix/fonts/目录下
然后更做一个graphfont.ttf软链接文件
然后回到zabbix界面,刷新预览,这下可以看到中文了
可以查看监测中的数据,监测中、最新数据、选择主机、点击应用
可以看到监测项目中都有数据,也可以点击右边的图形查看
9.自动发现
自动发现规则的数据获取间隔,修改为60s,点击更新
为了更快生效,回到虚拟机上,启动zabbix服务端和客户端服务
刷新之后,图形中的规则变成5个
可以选择监控中、图形,会出现网卡的流量图形(可以在虚拟机中上传文件,增大数据量方便观察)
更改图形界面(配置、模板、自动发现规则、图形原型)
10.添加自定义监控项目
- 需求:监控某台web的80端口连接数,并出图
- 两步:1)zabbix监控中心创建监控项目;2)针对该监控项目以图形展现
- 对于第一步,需要到客户端定义脚本
- vim /usr/local/sbin/estab.sh //内容如下
#!/bin/bash
##获取80端口并发连接数
netstat -ant |grep ':80 ' |grep -c ESTABLISHED
- chmod 755 /usr/local/sbin/estab.sh
- 客户端上编辑配置文件 vim /etc/zabbix/zabbix_agentd.conf//增加
UnsafeUserParameters=1 //表示使用自定义脚本
UserParameter=my.estab.count[*],/usr/local/sbin/estab.sh
//自定义监控项的key为my.estab.count,后面的[*]里面写脚本的参数,如果没有参数则可以省略,脚本为/usr/local/sbin/estab.sh
- 重启zabbix-agent服务 systemctl restart zabbix-agent
- 首先到服务端验证,执行命令
- zabbix_get -s 192.168.133.132 -p 10050 -k 'my.estab.count‘
- 然后在zabbix监控中心(浏览器)配置增加监控项目
- 键值写my.estab.count
- 添加该项目后,到“监测中” “最新数据”查看刚添加的项目是否有数据出现
- 有了数据就可以添加图形了
- “配置”“主机” “图形” “创建图形”
首先在客户端上编写脚本,内容如下,保存退出
添加zabbix用户执行的权限
客户端上编辑配置文件,搜索 /UnsafeUserParameters
UnsafeUserParameters=1 ,目的是使用自定义脚本
重启zabbix服务
服务端验证脚本是否生效
web端zabbix监控中心增加监控项目(配置、主机 、监控项、创建监控项)
添加图形(图形、创建图形)
然后选择预览
添加一个触发器(触发器、创建触发器),并发连接数最新值T大于N(自定义该值,在此N=200)时触发该警报
11.配置邮件告警
首先登录163邮箱,开启POP3、IMAP、SMTP服务,开启并记住授权码
进入zabbix的web界面,监控中心设置邮件告警( 管理、报警媒介类型、创建媒体类型)
创建报警脚本mail.py,添加内容如下,保存退出
#!/usr/bin/env python
#-*- coding: UTF-8 -*-
import os,sys
reload(sys)
sys.setdefaultencoding('utf8')
import getopt
import smtplib
from email.MIMEText import MIMEText
from email.MIMEMultipart import MIMEMultipart
from subprocess import *
def sendqqmail(username,password,mailfrom,mailto,subject,content):
gserver = 'smtp.163.com'
##定义发邮件类型
gport = 25
try:
msg = MIMEText(unicode(content).encode('utf-8'))
msg['from'] = mailfrom
msg['to'] = mailto
msg['Reply-To'] = mailfrom
msg['Subject'] = subject
smtp = smtplib.SMTP(gserver, gport)
smtp.set_debuglevel(0)
smtp.ehlo()
smtp.login(username,password)
smtp.sendmail(mailfrom, mailto, msg.as_string())
smtp.close()
except Exception,err:
print "Send mail failed. Error: %s" % err
def main():
to=sys.argv[1]
subject=sys.argv[2]
content=sys.argv[3]
##定义QQ邮箱的账号和密码,你需要修改成你自己的账号和密码(请不要把真实的用户名和密码放到网上公开,否则你会死的很惨)
sendqqmail('163邮箱','密码','163邮箱',to,subject,content)
if __name__ == "__main__":
main()
更改mail.py脚本的权限
测试mail.py是否能发邮件
打开163邮箱,会看到邮件
创建一个接受告警邮件的用户(管理、用户、创建用户);报警媒介,类型选择baojing
配置用户权限(管理、用户群组)
配置动作(配置、动作、创建动作)
12.测试告警
方便测试,创建一个自定义触发器(配置、主机、触发器、创建触发器)
仪表板出现报错信息
收到告警邮件
回到触发器负载改成大于1,仪表板显示正常,并查看邮箱
13、不发邮件的问题处理
用户权限
用户媒介有没有设置邮箱
发邮件脚本的权限是否755
脚本的位置是否在/usr/lib/zabbix/alertscripts/下
发邮件脚本是否能够发送邮件
zabbix配置动作是否配置正确
邮箱服务器可能存在波动,更换告警的邮箱
问题依然没有解决时,恢复快照尝试重新安装配置一遍