这篇文章将介绍当WEB服务器报警,提示磁盘使用率问题和带宽满载时的一些排查思路和解决方案。
首先,我们一定要配置服务器的云监控,如果是云厂商的服务器都有监控服务,开通即可。
如果是自建机房,监控报警策略也是必须搭建的。
磁盘使用率报警
原因分析
- 日志没有及时迁移或清理
- 程序异常输出了大量的垃圾文件
- 挂载的硬盘存储空间不足,不适应业务发展,需要挂载新的磁盘。
解决方案
1. 日志迁移或清理
我们需要Nginx日志和项目运行中的关键日志,方便定位问题、数据分析。
日志迁移的思路很简单,目前主流的云厂商都支持日志迁移和存储服务,且成本不高。
如果是自建的服务,可以挂载专门的存储硬盘,不和业务服务器耦合在一起,将日志进行单独存储。
2. 日志清理
- 切换到根目录
cd /
复制代码
- 查找到大文件,比如找到大于100M的文件
find . size +100M
复制代码
- 没用的日志大文件置为空(不要直接删除,正在被使用的文件是无法直接删除的)
cat /dev/null > /data/logs/php-fpm/error.log
复制代码
网站流量异常,一直在报警
当网站流量报警时喜忧参半,如果是因为搞活动或者网站内容命中了热点,被搜索引擎推荐,那真是像买彩票中奖一样高兴。
不过,大多数情况,网站在毫无预兆的情况下突然打满带宽,大概率是被恶意攻击了。
下面介绍一下我的排查思路
首先我登录了网站的统计服务平台,发现PV/UV等关键数据并没有太大变化,但是服务器的带宽却被打满了,说明异常流量不是通过刷网站页面导致的,可能是通过刷接口导致的。
服务器异常流量排查与解决方案

本文详述了服务器出现磁盘使用率报警和网站流量异常的排查与解决过程。通过分析日志,发现并处理了大文件,封禁了恶意IP,并优化了内网传输,最终使服务器恢复正常。
最低0.47元/天 解锁文章
3万+

被折叠的 条评论
为什么被折叠?



