前段时间,项目在线上出现问题,项目部署在Linux(Centos7)服务器上,本文主要讨论一下使用相关命令进行故障探测。
ps :可以查看当前Linux 正在运行的进程的状态,找出进程对应的PID 号,进程的CPU 和内存占用,运行时间等。
stace :可以追踪进程的系统调用。
lsof: 可以给出进程所有打开的文件,而Linux 下一切皆文件,比如硬件设备、网络连接等
Linux观察工具
使用三个命令(ps,strace,lsof)进行故障探测.
ps
ps 命令常用的指令
ps auxf
ps 显示的信息的含义
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 816 0.0 0.2 460500 2260 ? Ssl May14 3:01 ./aegis_update -f agx_update.cfg
root 842 0.0 0.0 4404 736 ? S May14 0:00 /bin/sh /alidata/server/mysql/bin/mysqld_safe --da
mysql 1118 0.0 3.9 404884 39988 ? Sl May14 7:35 \_ /alidata/server/mysql/bin/mysqld --basedir=/al
root 1140 0.0 0.0 30944