蓝鲸监控日志安装
1.虚拟机准备
ip | cpu | 内存 | 磁盘 |
---|---|---|---|
192.168.2.205(监控平台) | 8 | 32G | 150G |
192.168.2.204(日志平台) | 8 | 32G | 150G |
2.前置准备
1. 免密设置
#中控节点免密设置
ssh-copy-id 192.168.2.205
#监控节点免密设置
ssh-keygen
ssh-copy-id 192.168.2.203
2.安装包准备
中控节点操作
cd /data
tar xf bkce_co_package-6.0.3.tgz
https://bk.tencent.com/download/
#官网下载流程模板bk_sops_co_package-6.0.3.dat
3.安装主机
每增加一个机器都需这个安装Agent,不然无法监控采集日志
节点管理 --> Agent管理 --> Agent普通安装
安装日志查看
4.创建流程模板
标准运维 --> 项目流程 --> 导入 --> 点击上传 --> 创建新流程
bk_sops_co_package-6.0.3.dat
创建完会显示
5.检查install.conf
#检查install.conf文件如果文件中有相关模块的内容需要先进性删除在部署相关模块
value_modules=(es7 monitorv3\(influxdb-proxy\) monitorv3\(monitor\) monitorv3\(grafana\) influxdb\(bkmonitorv3\) monitorv3\(transfer\) fta beanstalk log\(grafana\) log\(api\) kafka\(config\))
for module in ${value_modules[@]}; do if grep ${module} /data/install/install.config >/dev/null; then echo -e "The \e[1;31m ${module} \e[0m module exists in install.config, please remove it before deploying."; fi; done
3.监控平台部署
选择 [ce][deploy][bkmonitorv3]
流程模版进行新建任务,根据提示填写相关信息。确认填写信息无误后,开始执行任务。
填写信息包括:
ctrl_ip
:基础环境的中控机 IPwhole_pkg_path
:部署监控平台安装包的绝对路径/data/bkmonitorv3_package-3.3.1731.tgz
deply_iplist
:新增的机器 IP(如果基础环境的资源有富余,可以复用)
监控平台的仪表大盘
4.日志平台部署
选择 [ce][deploy][bklog]
流程模版进行新建任务,根据提示填写相关信息。确认填写信息无误后,开始执行任务。
填写信息包括:
ctrl_ip
:基础环境的中控机 IPwhole_pkg_path
:部署日志平台安装包的绝对路径/data/bklog_package-4.2.580.tgz
deply_iplist
:新增的机器 IP(如果基础环境的资源有富余,可以复用)
监控平台和日志平台部署完会在界面显示出平台,可以点开查看其中的功能
问题
- 安装bkmonitorv3报错超时
解决方式:
https://bk.tencent.com/s-mart/community/question/1405
我处理过程
#1. 找到paas和appo两个模块所在的机器
grep -E "nginx|nodeman" /data/install/install.config
192.168.2.201 nginx,paas,consul,mongodb,rabbitmq,appo
192.168.2.202 cmdb,job,zk(config),appt,consul,nodeman(nodeman)
#paas和appo模块都在192.168.2.201上
#2. 修改对应模块的超时配置
paas
vim /data/qyos/paas_agent/paas_agent/etc/paas_agent_config.yaml
#修改该配置项
EXECUTE_TIME_LIMIT=9000
appo
vim /data/qyos/open_paas/paas/conf/settings_production.py
#在配置文件内任意处新增该配置项。
EVENT_STATE_EXPIRE_SECONDS =9000
#3. 重启paas和appo两个模块服务
cd /data/install
./bkcli restart paas
./bkcli restart appo