原创作者:运维工程师 谢晋
linux常见问题解决思路
- 系统响应时间明显延长,用户操作卡顿,应用程序启动缓慢。
# 查看系统负载
# uptime
# top -c
# htop
# 查看CPU使用情况
# vmstat 1 5
# iostat -x 1 5
# 查看内存使用
# free -h
# cat /proc/meminfo
解决方案
# 找出占用CPU最高的进程
# ps aux --sort=-%cpu | head -10
# 杀死异常进程(谨慎操作)
# kill -9 PID
# 清理系统缓存(谨慎使用)
# echo 3 > /proc/sys/vm/drop_caches
长期优化解决
• 调整进程优先级:nice -n 10 command
• 优化系统参数:调整/etc/sysctl.conf
• 增加资源或优化应用程序
- 磁盘空间不足
问题现象
• 系统提示"No space left on device"
• 无法创建新文件
• 应用程序异常退出
# 查看磁盘使用情况
# df -h
# du -sh /*
# du -sh /var/log/*
# 查找大文件
# find / -type f -size +100M -exec ls -lh {} \;
# find /var/log -name "*.log" -size +50M
# 查看inode使用情况
# df -i
解决方案
# 清理系统日志
# journalctl --vacuum-time=7d
# logrotate -f /etc/logrotate.conf
# 清理临时文件
# rm -rf /tmp/*
# rm -rf /var/tmp/*
# 清理包缓存
# apt clean # Ubuntu/Debian
# yum clean all # CentOS/RHEL
- 网络连接异常
问题现象
• 无法访问外网
• 服务间通信失败
• 网络延迟过高
# 检查网络接口
# ip addr show
# ifconfig
# 测试网络连通性
# ping -c 4 8.8.8.8
# traceroute google.com
# mtr google.com
# 检查路由表
# ip route show
# route -n
# 检查DNS解析
# nslookup baidu.com
dig baidu.com
# 检查防火墙状态
iptables -L -n
firewall-cmd --list-all
解决方案
# systemctl restart networking # Ubuntu
# systemctl restart network # Centos
# 手动配置IP(临时)
# ip addr add 192.168.1.100/24 dev eth0
# ip route add default via 192.168.1.1
# 修改DNS配置
# echo "nameserver 8.8.8.8" > /etc/resolv.conf
# echo "nameserver 114.114.114.114," >> /etc/resolv.conf
# 查看并允许特定端口
# iptables -A INPUT -p tcp --dport 80 -j ACCEPT
# iptables -A INPUT -p tcp --dport 443 -j ACCEPT
# 保存防火墙规则
# iptables-save > /etc/iptables/rules.v4