一、程序和进程
1、程序
- 保存在硬盘、光盘等介质中的可执行代码和数据
- 文件中静态保存的代码
2、进程
- 在CPU及内存中运行的程序代码
- 动态执行的代码
- 父、子进程
- 每个程序可以创建一个或多个进程
3、线程
线程是CPU调度的最小单位(程序执行流的最小单元)
它被包含在进程之中,是进程中的实际运作单元
一条线程是进程中一个单一顺序的控制流
一个进程中可以并发多个线程,每条线程并行执行不同的任务。
4、线程与进程的关系
一个线程只能属于一个进程,而一个进程可以有多个线程,但至少有一个线程
资源分配给进程,同一进程内的所有线程共享该进程的所有资源
线程在执行过程中需要协作同步。不同进程中的线程之间要利用消息通信的方法实现同步
处理机分配给线程,即真正在处理机上运行的是线程
线程是进程的一个执行单元,也是进程内的可调用实体。
二、查看进程信息的命令(ps、top、pgrep、pstree)
1、查看静态的进程统计信息ps命令:ps aux(-可加可不加)
1.1、代码
[root@localhost~]# ps aux
#查看静态的进程统计信息
字符 | 说明 |
---|---|
a | 显示终端上的所有进程,包括其他用户的进程 |
u | 表示列出进程的用户 |
x | 显示所有终端的进程 |
ps -aT # 显示所有线程
ps -T -p <pid> # 查看指定进程中已经起的线程
ps -L <pid>
查看指定进程中的线程信息
ps aux --sort -%cpu | head -10
ps aux --sort +pmem| head -10
### 按cpu降序排列, -为降序,+为升序,p与%同义
head -n 10
按内存升序排列
ps aux -- sort -pcpu, +pmem | head -n 10
###先按cpu占用率降序排序,若有cpu占用率一样时,按照后面的内存占用率升序排序
1.2、示例
1.3、各列的解释
各列名称 | 说明 |
---|---|
USER | 进程的用户 |
PID | 进程的ID |
%CPU | 进程占用的CPU百分比 |
%MEM | 占用内存的百分比 |
VSZ | 该进程使用的虚拟内存量(KB) |
RSS | 该进程占用的物理内存量(KB) |
TTY | 启动进程的终端名。不是从终端启动的进程则显示为? |
STAT | 该进程的状态 |
START | 该进程被触发启动时间 |
TIME | 该进程实际使用CPU运行的时间 |
COMMAND | 进程的启动命令 |
1.4、STAT 进程状态
进程状态 | 说明 |
---|---|
D | 不可中断的休眠状态 |
R | 正在运行状态 |
S | 处于休眠状态,可被唤醒 |
T | 停止状态,可能是在后台暂停或进程处于跟踪调试状态 |
Z | 僵尸进程,进程已经中止,但是部分程序还在内存当中 |
1.5、僵尸进程
- 一个进程结束了,但是如果该进程的父进程已经先结束了,那么该进程就不会变成僵尸进程,因为每个进程结束的时候,系统都会扫描当前系统中所运行的所有进程,看有没有哪个进程是刚刚结束的这个进程的子进程,如果是的话,就由Init来接管它,成为它的父进程,子进程退出后init会回收其占用的相关资源。
- 但是当子进程比父进程先结束,而父进程又没有回收子进程,释放子进程占用的资源,此时子进程将成为一个僵进程。
2、查看静态的进程统计信息ps命令:ps -elf
2.1、代码
[root@localhost~]# ps -elf 这边的 - 必须加上
字符 | 说明 |
---|---|
-e | 显示系统内的所有进程信息 |
-l | 使用长格式显示进程信息 |
-f | 使用完整的格式显示进程信息 |
2.2、示例
2.3、各列的解释
各列名称 | 解释 |
---|---|
F | 内核分配给进程的系统标记 |
S | 进程的状态 |
UID | 启动这些进程的用户 |
PID | 进程的进程ID |
PPID | 父进程的进程号(如果该进程是由另一个进程启动的) |
C | 进程生命周期中的CPU使用率 |
PRI | 进程的优先级(越大的数字代表越低的优先级) |
NI | 谦让度值用来参与决定优先级 |
ADDR | 进程的内存地址 |
SZ | 假如进程被换出,所需交换空间的大致大小 |
WCHAN | 若该进程在睡眠,则显示睡眠中的系统函数名 |
STIME | 进程启动时的系统时间 |
TTY | 进程启动时的终端设备 |
TIME | 运行进程需要的累计CPU时间 |
CMD | 进程的启动命令 |
tty终端
- Centos7系统,tty1表示图形界面,tty2-tty6表示文字界面,可以用Ctr1+Alt+F1-F6切换。
- pts说明是用远程工具连接的,比如xshell,后面的数字代表登录的时间顺序,越小证明登录的越早
3、查看动态的进程排名信息:top命令
3.1、top命令
[root@localhost~]# top 每5秒刷新一次
#专门查看IO的进程信息
iostat 、atop 、vmstat 、pidstat
#专门查看内存的信息可以用
free -m 、 vmstat
#专门查看CPU的信息可以用
top 、vmstat
#专门查看网卡流量的信息可以用
ifconfig 、 ftop
#专门查看磁盘使用情况可以用
df 、du 、atop
#专门查看进程可以用
ps 、 top 、 htop 、 atop 、 pidstat
top -H # 显示所有线程
top -H -P <pid>: # 显示特定进程中的线程
3.2、各行的解释
第一行:任务队列信息
信息 | 说明 |
---|---|
13:42:30 | 系统时间 |
up 4:37 | 系统已运行时长 |
1 user | 当前登录用户数 |
load average:0.00,0.01,0.05 | 系统平均负载,即单位时间内系统处理的任务数,后面三个数值分别为1分钟、5分钟、15分钟前到现在的平均值 |
查看系统平均负载的情况有哪些命令:top、w、uptime
#后面的三个值是1分钟、5分钟、15分钟时处理的任务数的平均值,当这些数值超过CPU的80%就代表当前的系统一直在高负荷运行(70%以下是正常范围)
第二行:进程信息
信息 | 说明 |
---|---|
Tasks | 总进程数 |
running | 正在运行的进程数 |
sleeping | 休眠的进程数 |
stopped | 中止的进程数 |
zombie | 僵死的进程数 |
第三行:CPU的信息
信息 | 说明 |
---|---|
us | 用户占用 |
sy | 内核占用 |
ni | 优先级调度占用 |
id | 空闲CPU,要了解空闲的 CPU 的百分比,主要看 %id 部分 |
wa | I/O 等待占用 |
hi | 硬件中断占用 |
si | 软件中断占用 |
st | 虚拟化占用 |
第四行:内存的信息
信息 | 说明 |
---|---|
total | 总内存空间 |
free | 空闲内存 |
used | 已用内存 |
buff/cache | 物理内存和交换内存的缓冲区总和 |
第五行:交换空间的信息
信息 | 说明 |
---|---|
total | 总交换空间 |
free | 空闲交换空间 |
used | 已用交换空间 |
avail Mem | 可用物理空间 |
3.3、进程信息区各列解释
各列名称 | 解释 |
---|---|
PID | 进程id |
USER | 进程所有者的用户名 |
PR | 优先级 |
NI | 谦让度值。谦让度越高,优先级越低。复制表示高优先级,正值表示低优先级 |
VIRT | 进程使用的虚拟内存总量,单位kb |
RES | 进程使用的物理内存大小,单位kb |
SHR | 共享内存大小,单位kb |
S | 进程状态 |
%CPU | 上次更新到现在的CPU时间占用百分比 |
%MEM | 进程使用的物理内存百分比 |
TIME+ | 进程使用的CPU时间总计,单位1/100秒 |
COMMAND | 命令名/命令行 |
3.4、top常用命令
命令 | 解释 |
---|---|
P键 | 根据CPU使用百分比大小进行排序 |
M键 | 根据驻留内存大小进行排序 |
N键 | 根据启动时间进行排序 |
c键 | 切换显示命令名称和完整命令行 |
h键 | 可以获得top程序的在线帮助信息 |
k键 | 根据提示输入指定进程的PID号并按Enter键终止对应的进程 |
q键 | 退出top程序 |
数字1键 | 显示CPU个数和状态 |
4、根据特定条件查询进程PID信息:pgrep命令
[root@localhost~]# pgrep -l "ping"
2128 ping
[root@localhost~]# pgrep -l -U teacher -t tty2
27483 bash
27584 vim
选项 | 说明 |
---|---|
-l | 显示进程名,缺省时只输出PID号 |
-U | 指定特定用户 |
-t | 指定终端 |
5、以树形结构列出进程信息:pstree命令
[root@localhost ~]# pstree -aup
init,1
....//省略部分信息
login,3221
bash,27483,teacher
vim,27674 myfile.txt
.....//省略部分信息
[root@localhost ~]# pstree -ap teacher
bash,27483
vim,27674 myfile.txt
三、进程的启动与控制
1、进程的启动方式
1.1、手工启动
-
前台启动:用户输入命令,直接执行程序
-
后台启动:在命令行尾加入“&”符号
[root@localhost ~]# cp /dev/cdrom mycd.iso &
[1]28454 ##输出信息中包括后台任务序号、PID号
1.2、调度启动
- 使用at命令
- 使用crontab命令,设置周期性计划任务
2、进程的前后台调度
Ctrl+Z组合键
- 将当前进程挂起,即调入后台并停止执行
jobs命令
- jobs [-l]
- 查看处于后台的任务列表
fg命令
将后台进程恢复到前台运行,可指定任务序号
[root@localhost ~]# jobs
[1]- Stopped cp /dev/cdrom mycd.iso
[2]+ Stopped top
[root@localhost ~]# fg 1
3、终止进程的运行
-
Ctrl+C组合键
。 中断正在执行的命令 -
kill、killall命令
。 kill用于终止指定PID号的进程
。 killall用于终止指定名称相关的所有进程
。 -9选项用于强制终止
kill命令符选项 | 说明 |
---|---|
-1 SIGHUP | 重新加载某个进程 |
-3 SIGQUIT | 告诉进程保存日志后关闭退出 |
-9 SIGKILL | 表示进程被终止,需要立即退出(不可被捕获也不能被忽略) |
-15 SIGTERM | 告诉进程你需要被关闭,请自行停止运行并推出 (可被捕获也能被忽略) |
kill [-n] -s <信号名> <PID>
###-n:选择发送指定的信号给进程,n为信号数,默认15
###-s:选择发送指定的信号给进程,参数为信号数对应的信号名,默认为SIGTERN
###PID:杀死指定PID的进程
killall <进程名> ###关闭所有用户的指定进程
- pkill命令
。 根据特定条件终止相应的进程
常用命令选项
选项 | 说明 |
---|---|
-t | 根据进程所在的终端终止相应进程 |
-U | 根据进程所属的用户名终止相应进程 |
[root@localhost ~]# pgrep -l -U "xc04"
2381 bash
[root@localhost ~]# pkill -9 -U "xc04"
已杀死
[root@localhost ~]# pgrep -l -U "xc04"
四、计划任务管理(at命令、crontab命令)
1、at命令
- 一次性计划任务
[root@localhost ~]# date
2023年 04月 12日 星期三 16:04:56 CST
[root@localhost ~]# at 16:07 2023-04-12
at> pgrep -U root | WC -l > /tmp/ps.root
at> <EOT>
按Ctrl+ D键提交任务
job 1 at Wed Apr 12 16:07:00 2023
[root@localhost ~]# cat /tmp/ps.root
- 案例在当天的21:30时自动关闭当前系统
[root@localhost ~]# at 21:30
##不携带日期表示为当天
at> shutdown -h now
at> <EOT>
##按CtrI+D键提交任务
job 2 at Sun May 7 21:30:00 2017
[root@localhost ~]# atq
##查看未执行的任务列表
2 Sun May 7 21:30:00 2017 a root
[root@localhost ~]# atrm 1
##删除第1条任务
[root@localhost ~]# atq
2、crontab命令
2.1、crontab命令
按照预先设置的时间周期(分钟、小时、天、月、周)重复执行用户指定的命令操作
分时日月周 属于周期性计划任务
- 主要设置文件
主要设置文件 | 位置 |
---|---|
全局配置文件 | 位于文件: /etc/crontab |
系统默认的设置 | 位于目录: /etc/cron.*/ |
用户定义的设置 | 位于文件: /var/spool/cron/用户名 |
2.2、管理crontab计划任务
编辑计划任务
查看计划任务
删除计划任务
2.3、crontab任务配置的格式
六个字段
代表意义 | 数字范围 |
---|---|
分钟 | 取值从0到59之间的任意整数 |
小时 | 取值从0到23之间的任意整数 |
日期 | 取值从1到31之间的任意整数 |
月份 | 取值从1到12之间的任意整数 |
星期 | 取值为0到7之间的任意整数,0或7代表星期日 |
命令 | 要执行的命令或程序脚本 |
时间数值的特殊表示方法
选项 | 说明 |
---|---|
* | 表示该范围内的任意时间 |
, | 表示间隔的多个不连续时间点 |
- | 表示一个连续的时间范围 |
/ | 指定间隔的时间频率 |
应用示例
示例 | 含义 |
---|---|
0 17 * * 1-5 | 周一到周五每天17:00 |
30 8 * * 1,3,5 | 每周一、三、五的8点30分 |
0 8-18/2 * * * | 8点到18点之间每2小时 |
0 * */3 * * | 每3天 |
2.4、crontab任务配置
1.每分钟定时执行一次规则:
每1分钟执行: */1 * * * *或者 * * * * *
每5分钟执行: */5 * * * *
2.每小时定时执行一次规则:
每小时执行:0 * * * * 或者0 */1 * * *
每天上午7点执行: 0 7 * * *
每天上午7点10分执行: 10 7 * * *
3.每天定时执行一次规则:
每天执行 0 0 * * *
4.每周定时执行一次规则:
每周执行 0 0 * * 1
5.每月定时执行一次规则:
每月执行 0 0 1 * *
6.每年定时执行一次规则:
每年执行 0 0 1 1 *
7.其他例子
5 * * * * ls 指定每小时的第5分钟执行一次ls命令
30 5 * * * ls 指定每天的5:30执行ls命令
30 7 8 * * ls 指定每月8号的7: 30分执行ls命令
30 5 8 6 * ls 指定每年的6月8日5: 30执行ls命令
30 6 * * 0 ls 指定每星期日的6:30执行ls命令[注: 0表示星期天,1表示星期1,以此类推,也可以用英文来表示,sun表示星期天,mon表示星期一等]
30 3 10,20 * * ls 每月10号及20号的3: 30执行ls命令[注:“-"用来连接多个不连续的时段]
25 8-11 * * * ls 每天8-11点的第25分钟执行ls命令[注: “-"用来连接连续的时段]
*/15 * * * * ls 每15分钟执行一次ls命令 [即每个小时的第0 15 30 45 60分钟执行ls命令]
30 6 */10 * * ls 每个月中,每隔10天6:30执行一次ls命令[即每月的1、11、21、31日是的6: 30执行一次ls命令。 ]
方法二:
echo ‘30 7 * * 6 /usr/bin/systemct1 httpd restart’ >> /var/spool/cron/ root ##用绝对路径表示命令
1,6月的每个周六从.上午10点到下午的4点的每10分钟执行ls -l
*/10 10-16 * 1,6 6 /usr/bin/ls -l ##用绝对路径表示命令
五、补充
1.如何检测I/O
- 在衡量磁盘性能时,我们经常提到五个常见指标:利用率、饱和度、IOPS、吞吐量和响应时间。
- 这五个指标是衡量磁盘性能的基本指标。
利用率(Utilization):磁盘处理 I/O 的时间百分比。过度使用(如超过 80%)通常意味着磁盘 I/O 存在性能瓶颈。
== 饱和度(Saturation)==:指磁盘处理 I/O 的繁忙程度。过度饱和意味着磁盘存在严重的性能瓶颈。当饱和度为 100% 时,磁盘无法接受新的 I/O 请求。
== IOPS(Input/Output Per Second)==:指每秒 I/O 请求的数量。
吞吐量(Throughput):每秒 I/O 请求的大小。
响应时间(Response time):指发送 I/O 请求和接收响应之间的间隔时间
iostat
vmstat
sar
2.平均负载
在 Linux 系统中,系统负载表示系统中当前正在运行的进程数量,其包括可运行状态的进程数和不可中断休眠状态的进程数的和。注意:不可中断休眠状态的进程一般是在等待 I/O 完成的进程。
时间越近的数据,对未来的预测准确性越高
系统负载 = 可运行状态进程数 + 不可中断休眠状态进程数
若每5秒统计一次系统负载,一分钟就为12次
5分钟为60次,15分钟为180次
平均负载 = 12次、60次、180次系统负载统计合/12次、60次、180次
3.常用的 Load 分析方法
(1).CPU高、Load高
通过 top 命令查找占用CPU最高的进程PID;
通过top -Hp PID查找占用CPU最高的线程TID;
(2).CPU低、Load高
产生的原因一句话总结就是:等待磁盘I/O完成的进程过多,导致进程队列长度过大,但是CPU运行的进程却很少,这样就体现到负载过大了,cpu使用率低。
通过top命令查看CPU等待IO时间,即%wa;
通过iostat -d -x -m 1 10查看磁盘IO情况;(安装命令 yum install -y sysstat)
通过sar -n DEV 1 10查看网络IO情况;
通过如下命令查找占用IO的程序;
ps -e -L h o state,cmd | awk '{if($1=="R"||$1=="D"){print $0}}' | sort | uniq -c | sort -k 1nr