【spark程序第一次把磁盘IO作为瓶颈了】今天写个博客,关于运维(但是,我TM是开发)

本文解析了Linux系统因IO子系统处理速度慢导致的系统失去响应问题。介绍了默认情况下,Linux会使用40%的内存作为文件系统缓存,当缓存写入磁盘的时间超过120秒,系统将进入挂起状态。文章提供了通过调整vm.dirty_ratio和vm.dirty_background_ratio参数来优化IO性能的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题引入

今天CDH的管理,报130失去连接,ssh也连不上,但是能ping通

查看系统日志

echo 0 > /proc/sys/kernel/hung_task_timeout_secs disables this message
百度结果:
https://blog.51cto.com/10983441/1782411
问题原因:
默认情况下, Linux会最多使用40%的可用内存作为文件系统缓存。当超过这个阈值后,文件系统会把将缓存中的内存全部写入磁盘, 导致后续的IO请求都是同步的。
将缓存写入磁盘时,有一个默认120秒的超时时间。 出现上面的问题的原因是IO子系统的处理速度不够快,不能在120秒将缓存中的数据全部写入磁盘。
IO系统响应缓慢,导致越来越多的请求堆积,最终系统内存全部被占用,导致系统失去响应。

解决方法:

根据应用程序情况,对vm.dirty_ratio,vm.dirty_background_ratio两个参数进行调优设置。 例如,推荐如下设置:
#sysctl -w vm.dirty_ratio=10
#sysctl -w vm.dirty_background_ratio=5
#sysctl -p
如果系统永久生效,修改/etc/sysctl.conf文件。加入如下两行:
#vi /etc/sysctl.conf
vm.dirty_background_ratio = 5
vm.dirty_ratio = 10
重启系统生效。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值