ceph现场问题解决(系统卡满导致mon无法启动)

最新推荐文章于 2024-11-29 19:24:52 发布

原创最新推荐文章于 2024-11-29 19:24:52 发布 · 1.3k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本文介绍了一种在16节点Ceph集群中，因Monrocksdb数据库sst文件过大导致系统卡分区满载的紧急处理方案。通过卸载无用rpm包和调整journal分区设置，成功释放空间并重启mon服务。

今天遇到一个现场，16节点每节点48盘位集群，5mon重启运行过程中，系统卡分区被挤爆，占用达100%，为了重启拉起mon，做了如下排查：

通过du -Bm --max-depth=1 / 和 du -d1 -Bm -h ./查找根分区下的大文件，找到mon rocksdb数据库的sst文件总和竟达到7g之多，这个肯定不能删，后续会专门说明一下这个文件为什么这么大
通过问题1找到了大文件，但是不能删，只能通过删除根分区下其他的大文件来讲根分区释放处理，大致找了下一些没有用处的rpm安装包，然后进行了卸载，命令如下：
yum autoremove texlive-base
yum autoremove mariadb-test
yum autoremove emacs
yum autoremove gnome-weather
yum autoremove net-snmp
yum autoremove net-snmp-libs
yum autoremove gimp
/var/log/journal/abf6c3e0a96f452ab2efd6c2d1a9c1e0/ 这个文件占用了大量空间，通过对journal分区的修改，释放出了近1g的空间，journal空间为日志/var/log/message的journal，journal的具体作用就不多说了，基本命令如下：
vi /etc/systemd/journald.conf
SystemMaxUse=800M 修改此值为80M
systemctl restart systemd-journald 重启该服务
ll /var/log/journal/abf6c3e0a96f452ab2efd6c2d1a9c1e0/ 查看大小确实变小了不少

经过上面几部的处理基本将系统卡空间释放出了不少，这时候重启了一下mon，mon起来了，mon运行一段时间后mon 数据库rocksdb 的sst文件被trim掉，空间彻底释放了出来。
在这里插入图片描述

.

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。