环境描述
三台机器,操作系统是CentOS 7.6 每台 CPU8核,硬盘 / 80G /data 500G,
Doris版本是 2.1.5,安装在/opt 目录下面,也就是 80G的目录下面,但是数据文件通过软链的形式存储在/data下面
SHOW PROC '/frontends';的结果如下所示
上面存储的数据比较简单,就是物联网设备每秒钟采集的数据会被同事收集到其他的mysql库中,通过数据可以看到哪些设备近10分钟内活着,且设备采集过来的数据是否要触发告警等,有2个工厂就有2个一样的库,库的数据还会增加,但是大屏那边需要看到合在一起的数据,每个库中的主键ID会重复,于是就将数据去掉主键ID后同步到Doris中,然后对数据做一些业务员逻辑。
1、表现出来的情况
1) 如上图中的显示,有两台FE一起正常运行的,但是有Socket is closed by peer.的报错信息,其实都没有成功加入到集群,这两台机器通过8030打开其WebUI都看不到主节点能显示的数据库。
2) 主节点机器FE中的doris-meta目录的磁盘占用不断升高,导致磁盘写满
3) 经常出现tablet数据丢失,报错信息一直打印导致日志文件占用磁盘也很大
2、查找原因
通过查找主