linux 系统缓慢 SAR -Q 看到好多活跃进程 不知道从哪里查出是哪些进程了 郁闷

本文通过使用sar工具展示了系统在不同时间段内的负载情况,包括运行队列中任务的数量、活跃任务的数量以及不同时间跨度下的系统负载百分比。这些数据有助于理解系统资源的利用效率并为性能调优提供依据。

从/proc/loadavg获得数据
runq-sz 采样时,运行队列中任务的个数,不包括vmstat 进程。 procs_running-1
plist-sz 采样时,系统中活跃的任务的个数 nr_threads
ldavg-1 采样的前一秒钟系统的负载(%) lavg_1
ldavg-5 采样的5秒钟系统的负载(%) lavg_5
ldavg-15 采样的前15秒钟系统的负载(%) lavg_15

[root@surgegate1 log]# sar -q
Linux 2.6.9-42.ELsmp (surgegate1)  01/30/2008

12:00:01 AM  runq-sz  plist-sz  ldavg-1  ldavg-5  ldavg-15
12:10:02 AM        2      300      1.44      1.57      1.13
12:20:01 AM        2      296      1.36      1.57      1.35
12:30:01 AM        2      295      1.73      1.70      1.52
12:40:01 AM        4      296      1.13      1.45      1.49
12:50:01 AM        5      293      1.10      1.25      1.36
01:00:01 AM        98      354    95.52    71.37    36.21
01:10:01 AM      108      357    105.33    97.30    66.50
01:20:01 AM      112      332    108.99    107.09    86.52
01:30:01 AM      115      332    111.91    110.48    97.99
01:40:01 AM      114      334    112.93    112.37    104.89
01:50:01 AM      116      332    112.99    112.89    108.70
02:00:01 AM      117      342    113.03    112.99    110.74
02:10:01 AM      139      421    132.37    125.51    117.69
02:20:01 AM      156      502    152.89    145.12    131.21
02:30:01 AM      179      578    172.96    165.14    147.79
02:40:01 AM      197      662    193.02    185.22    166.16
02:50:01 AM      218      738    213.23    205.44    185.35
03:00:01 AM      235      814    233.03    225.44    204.88
03:10:01 AM      238      812    234.98    233.45    219.06
03:20:01 AM      238      812    235.04    234.80    226.64
03:30:01 AM      236      814    235.03    234.97    230.58
03:40:01 AM      238      812    235.06    235.01    232.67
03:50:01 AM      236      814    235.00    235.01    233.78
04:00:01 AM      241      818    235.07    235.02    234.36
04:10:01 AM      260      912    255.56    248.83    241.21
04:20:01 AM      280      993    275.55    268.18    254.53
04:30:01 AM      300      1067    295.19    287.87    270.96

04:30:01 AM  runq-sz  plist-sz  ldavg-1  ldavg-5  ldavg-15
04:40:01 AM      318      1142    314.34    306.81    288.48
04:50:01 AM      337      1220    334.01    326.41    306.93
05:00:01 AM      356      1294    354.71    346.70    326.32
05:10:01 AM      358      1292    355.02    353.91    340.04
05:20:01 AM      355      1294    355.07    354.86    347.15
05:30:01 AM      356      1294    355.08    355.02    350.87
05:40:02 AM      355      1292    355.15    355.03    352.84
05:50:01 AM      357      1294    355.04    355.01    353.84
06:00:01 AM      358      1297    355.07    355.02    354.39
06:10:01 AM      377      1382    374.89    368.13    360.94
06:20:01 AM      397      1462    394.48    386.83    373.59
06:30:01 AM      418      1540    414.30    406.73    389.86
06:40:01 AM      438      1622    434.19    426.59    407.92
06:50:01 AM      458      1702    454.38    446.62    426.77
07:00:01 AM      475      1774    474.48    466.58    446.18
07:10:01 AM      478      1772    474.83    473.76    459.83
07:20:01 AM      478      1772    475.02    474.84    467.04
07:30:01 AM      475      1774    475.04    474.99    470.81
07:40:01 AM      476      1774    475.33    475.09    472.83
07:50:01 AM      476      1774    475.03    475.03    473.86
08:00:01 AM      478      1777    475.03    475.03    474.40
08:10:01 AM      498      1862    494.28    487.72    480.66
08:20:01 AM      524      1942    519.29    509.42    494.64
08:30:01 AM      548      2022    543.37    533.43    513.65
08:40:01 AM      575      2103    570.48    559.11    535.80
08:50:01 AM      602      2192    599.56    588.52    561.64
09:00:01 AM      624      2219    623.17    614.48    587.53

Average:      runq-sz  plist-sz  ldavg-1  ldavg-5  ldavg-15
Average:          299      1098    295.96    291.64    280.26

08:58:11 AM      LINUX RESTART

09:05:55 AM      LINUX RESTART

09:10:01 AM  runq-sz  plist-sz  ldavg-1  ldavg-5  ldavg-15
09:20:01 AM        0      160      4.38      4.23      2.02
09:30:01 AM        0      208      1.79      3.23      2.65
09:40:02 AM        2      208      3.93      2.86      2.61

<think>好的,我现在需要帮助用户解读sar命令中的三个参数:-q、-b和-n sock的输出结果。首先,我得回忆一下sar命令的基本用途,它是系统活动报告工具,属于sysstat包的一部分,用于收集和报告系统性能数据。 对于用户提到的三个参数,我需要逐个分析每个参数的作用以及输出中的各个指标。先从sar -q开始。我记得-q参数主要报告系统负载和队列相关的信息。常见的指标包括load average、运行队列大小、任务列表中的进程数等。需要详细解释每个指标的意义,比如1分钟、5分钟、15分钟的负载平均值,以及这些值超过CPU核心数可能意味着什么。还有ldavg-15这样的字段,可能代表过去15分钟的平均负载,需要确认是否正确。 接下来是sar -b,这个参数应该和I/O相关,特别是块设备的情况。常见的指标包括每秒的读写请求数、读写块数、以及I/O操作的等待时间等。需要解释每个指标如tps、rtps、wtps、bread/s、bwrtn/s等的含义,以及它们如何反映磁盘性能的问题,比如高tps可能表示磁盘繁忙,而高await可能意味着磁盘响应慢。 然后是sar -n sock,这部分是关于网络套接字的统计信息。需要说明各个字段如totsck、tcpsck、udpsck、rawsck等的含义,分别代表总套接字数、TCP、UDP、RAW套接字数量。此外,可能还有其他指标如tcp-tw,即TIME_WAIT状态的连接数,需要解释这些指标对系统网络性能的影响,比如大量的TIME_WAIT可能占用资源,需要调整内核参数。 在解释每个参数时,需要确保指标名称的准确性,可能需要查阅sar的man手册或相关资料确认,避免记忆错误。同时,要使用用户容易理解的语言,避免过于专业的术语,必要时举例说明正常范围和异常情况的判断标准。 另外,用户要求使用中文回答,结构清晰,分点解释。因此,每个参数单独作为一个部分,每个部分下用条目列出各个指标及其含义。最后可能需要总结如何根据这些指标进行系统性能分析,以及常见的优化建议。 需要检查是否有遗漏的重要指标,比如在sar -q中是否还有plist-sz这样的字段,代表任务列表中的进程数,或者是否有其他相关指标需要说明。同样,sar -b中的指标是否涵盖了块设备的所有关键I/O数据,比如是否包括缓冲区的使用情况等。 最后,确保LaTeX格式的正确使用,所有数学表达式和变量用$包围,独立公式用$$,但在这个问题中可能涉及较少数学公式,主要注意命令和代码的正确格式,比如使用反引号包裹命令和参数,保持代码清晰易读。 现在组织回答的结构,确保每个参数的解释详细但过于冗长,重点突出各个指标的意义和实际应用中的关注点。同时,避免错误信息,必要时参考官方文档或可靠来源进行验证。</think>以下是对 `sar -q`、`sar -b`、`sar -n sock` 输出结果的详细解读: --- ### **1. `sar -q`:系统负载与队列状态** 主要监控 **运行队列** 和 **负载** 相关指标,常用于分析 CPU 压力及任务调度情况: - **`runq-sz`**:运行队列长度(等待 CPU 的进程数),**长期超过 CPU 核心数** 可能表示 CPU 资源足。 - **`plist-sz`**:任务列表中的总进程数(包括运行、睡眠、僵尸进程等)。 - **`ldavg-1/5/15`**:1/5/15 分钟的平均负载,**超过 CPU 核心数** 表示系统过载。 - **`blocked`**:等待 I/O 完成的进程数,持续偏高可能表明 I/O 瓶颈。 **示例分析**: ```bash $ sar -q 1 5 Linux 5.4.0-91-generic (host) 12/01/2023 _x86_64_ (4 CPU) 12:00:01 runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 blocked 12:00:02 2 256 0.25 0.30 0.35 0 ``` - `runq-sz=2`:当前有 2 个进程等待 CPU。 - `ldavg-1=0.25`:1 分钟平均负载为 0.25(4 核 CPU 下,负载 <4 为正常)。 --- ### **2. `sar -b`:I/O 与块设备统计** 监控 **块设备 I/O 性能**,帮助定位磁盘瓶颈: - **`tps`**:每秒传输次数(I/O 请求数),高值可能表示磁盘繁忙。 - **`rtps`**:每秒读请求数。 - **`wtps`**:每秒写请求数。 - **`bread/s`**:每秒读取的块数(1块=512字节)。 - **`bwrtn/s`**:每秒写入的块数。 - **`avgrq-sz`**:平均每次 I/O 请求的数据量(单位为扇区,1扇区=512字节)。 - **`await`**:I/O 请求平均等待时间(ms),**超过 10ms** 可能表明磁盘延迟高。 **示例分析**: ```bash $ sar -b 1 3 Linux 5.4.0-91-generic (host) 12/01/2023 _x86_64_ (4 CPU) 12:05:01 tps rtps wtps bread/s bwrtn/s avgrq-sz await 12:05:02 12.0 8.0 4.0 4096.0 2048.0 12.5 5.2 ``` - `tps=12`:每秒 12 次 I/O 操作。 - `await=5.2ms`:I/O 平均等待时间较短,磁盘响应良好。 --- ### **3. `sar -n SOCK`:网络套接字统计** 监控 **网络套接字使用情况**,用于分析网络连接状态: - **`totsck`**:总套接字数,突然增长可能表明连接泄漏。 - **`tcpsck`**:正在使用的 TCP 套接字数。 - **`udpsck`**:正在使用的 UDP 套接字数。 - **`rawsck`**:RAW 套接字数(通常较少)。 - **`tcp-tw`**:处于 `TIME_WAIT` 状态的 TCP 连接数,**过多** 可能需调整 `net.ipv4.tcp_max_tw_buckets`。 **示例分析**: ```bash $ sar -n SOCK 1 2 Linux 5.4.0-91-generic (host) 12/01/2023 _x86_64_ (4 CPU) 12:10:01 totsck tcpsck udpsck rawsck tcp-tw 12:10:02 356 123 45 0 22 ``` - `tcpsck=123`:当前有 123 个 TCP 连接。 - `tcp-tw=22`:22 个连接处于 `TIME_WAIT` 状态(正常范围)。 --- ### **总结建议** - **`sar -q`**:关注 `ldavg` 和 `runq-sz`,判断 CPU 是否过载。 - **`sar -b`**:结合 `tps` 和 `await`,分析磁盘 I/O 性能。 - **`sar -n SOCK`**:监控 `tcp-tw` 和 `totsck`,防止连接数耗尽。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值