那些磁盘不足导致集群失败的事儿

最新推荐文章于 2025-04-02 14:36:05 发布

NmapProMax

最新推荐文章于 2025-04-02 14:36:05 发布

阅读量1.1k

点赞数 1

分类专栏：随笔日常bug

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_43718211/article/details/86496144

版权

随笔同时被 2 个专栏收录

36 篇文章

订阅专栏

7 篇文章

订阅专栏

本文分享了一次因磁盘空间不足导致集群无法启动的经历，详细介绍了如何通过查找并清理大文件，尤其是Kafka日志文件，来解决此问题。同时，文章还提供了设置日志滚动的方法，以预防未来再次发生类似情况。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这里笔者分享自己的一次经历:
有一天发现自己的集群启动不起来，jps看了一下，发现是磁盘空间不足。
Insufficient space for shared memory file:共享内存文件空间不足
在这里插入图片描述
下面是我的解决方法：
命令：find / -type f -size +500M
查看/目录下大于500兆的文件

可以看到查询的结果大部分都是/usr/local/kafka/logs/下的
那我们肯定要去那个路径看一看:进去之后，
使用命令:du -h +被查看目录
-h以K，M，G为单位，提高信息的可读性
在这里插入图片描述
我们能够看到hadoop02的logs占了6.5个G，而hadoop03机器的logs占用磁盘高达13G，而笔者每台机器分的是20G。
既然找到原因我们只需要把logs清一下就ok了。当然我们也可以设置日志滚动，让它保存7天，超过7天删除掉。
另外磁盘不足导致集群非正常关闭，jps可能会出现
process information unavailable
给大家推荐一个博客：
Linux服务器jps报process information unavailable
https://www.cnblogs.com/freeweb/p/5748424.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。