linux系统cpu、内存、磁盘IO异常查询方式汇总_top wa

为了做好运维面试路上的助攻手,特整理了上百道 【运维技术栈面试题集锦】 ,让你面试不慌心不跳,高薪offer怀里抱!

这次整理的面试题,小到shell、MySQL,大到K8s等云原生技术栈,不仅适合运维新人入行面试需要,还适用于想提升进阶跳槽加薪的运维朋友。

本份面试集锦涵盖了

  • 174 道运维工程师面试题
  • 128道k8s面试题
  • 108道shell脚本面试题
  • 200道Linux面试题
  • 51道docker面试题
  • 35道Jenkis面试题
  • 78道MongoDB面试题
  • 17道ansible面试题
  • 60道dubbo面试题
  • 53道kafka面试
  • 18道mysql面试题
  • 40道nginx面试题
  • 77道redis面试题
  • 28道zookeeper

总计 1000+ 道面试题, 内容 又全含金量又高

  • 174道运维工程师面试题

1、什么是运维?

2、在工作中,运维人员经常需要跟运营人员打交道,请问运营人员是做什么工作的?

3、现在给你三百台服务器,你怎么对他们进行管理?

4、简述raid0 raid1raid5二种工作模式的工作原理及特点

5、LVS、Nginx、HAproxy有什么区别?工作中你怎么选择?

6、Squid、Varinsh和Nginx有什么区别,工作中你怎么选择?

7、Tomcat和Resin有什么区别,工作中你怎么选择?

8、什么是中间件?什么是jdk?

9、讲述一下Tomcat8005、8009、8080三个端口的含义?

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

第二部分(-/+ buffers/cache):
(-buffers/cache) used内存数:286M (指的第一部分Mem行中的used – buffers – cached)
(+buffers/cache) free内存数: 715M (指的第一部分Mem行中的free + buffers + cached)

可见-buffers/cache反映的是被程序实实在在吃掉的内存,而+buffers/cache反映的是可以挪用的内存总数.

第三部分是指交换分区,当used为0时说明内存不紧张,数字较小时内存有点紧张,较大时说明内存已不够用。

3.2、vmstat 2 5也可查看内存使用情况。

3.3、top命令进入后输入M按内存使用排序,可以找到占用内存较高进程。

4、IO使用情况定位

4.1、top查询wa的使用情况,查看io占用cpu是否较高。

4.2、iostat -x 2 5查看各磁盘的%util情况,越高说明磁盘对应的io越高。

[serviceop@SZA-L0016461 ~]$ iostat -x 2 5
Linux 2.6.32-573.el6.x86_64 (SZA-L0016461)  2017年04月27日  _x86_64_ (2 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           1.38    0.00    1.85    0.05    0.00   96.72

Device:         rrqm/s   wrqm/s     r/s     w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util
sda               0.05     6.58    0.12    3.43     8.17    80.10    24.84     0.00    1.39   0.59   0.21
dm-0              0.00     0.00    0.14    7.67     7.66    61.39     8.84     0.04    4.54   0.15   0.12
dm-1              0.00     0.00    0.00    0.00     0.00     0.00     8.00     0.00    0.46   0.42   0.00
dm-2              0.00     0.00    0.03    0.56     0.35     4.51     8.24     0.00    7.06   0.11   0.01
dm-3              0.00     0.00    0.00    0.52     0.15     4.15     8.22     0.00    1.91   0.43   0.02
dm-4              0.00     0.00    0.00    0.00     0.00     0.00     2.57     0.00    1.89   1.45   0.00
dm-5              0.00     0.00    0.00    1.26     0.00    10.05     8.00     0.00    1.16   0.56   0.07
sdb               0.00     2.55    0.10    0.66    16.00    25.79    55.24     0.00    3.06   1.19   0.09
dm-6              0.00     0.00    0.10    3.22    16.00    25.79    12.62     0.08   22.76   0.27   0.09

4.3、iotop直接查看IO较高的进程号,当iotop命令不可以用时使用for x in seq 1 1 10; do ps -eo state,pid,cmd | grep “^D”; echo “----”; sleep 5; done查询IO等待的对应进程

# for x in seq 1 1 10; do ps -eo state,pid,cmd | grep “^D”; echo “----”; sleep 5; done
D 248 [jbd2/dm-0-8]
D 16528 bonnie++ -n 0 -u 0 -r 239 -s 478 -f -b -d /tmp

4.4、cat /proc/pid/io查看对应进程使用的io情况

cat /proc/16528/io

rchar: 48752567
wchar: 549961789
syscr: 5967
syscw: 67138
read_bytes: 49020928
write_bytes: 549961728
cancelled_write_bytes: 0

4.5、lsof -p pid 或 ls /proc/pid/fd查看对应的应用目录

lsof -p 16528

COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
bonnie++ 16528 rootcwdDIR 252,0 4096 130597 /tmp

bonnie++ 16528 root 8u REG 252,0 501219328 131869 /tmp/Bonnie.16528
bonnie++ 16528 root 9u REG 252,0 501219328 131869 /tmp/Bonnie.16528
bonnie++ 16528 root 10u REG 252,0 501219328 131869 /tmp/Bonnie.16528
bonnie++ 16528 root 11u REG 252,0 501219328 131869 /tmp/Bonnie.16528
bonnie++ 16528 root 12u REG 252,0 501219328 131869 /tmp/Bonnie.16528

4.5、fd /tmp查看对应的卷名

df /tmp

Filesystem 1K-blocksUsedAvailableUse% Mountedon
/dev/mapper/workstation-root 7667140 2628608 4653920 37% /

4.6、是fdisk -l 或pvdisplay 查看对应的磁盘,来确认是否与io高的磁盘一致。

业务级IO监控

ioprofile

ioprofile 命令本质上是 lsof + strace, 具体下载可见 http://code.google.com/p/maatkit/

ioprofile 可以回答你以下三个问题:

1  当前进程某时间内,在业务层面读写了哪些文件(read, write)?

2  读写次数是多少?(read, write的调用次数)

3  读写数据量多少?(read, write的byte数)

假设某个行为会触发程序一次IO动作,例如: “一个页面点击,导致后台读取A,B,C文件”

============================================

./io_event   # 假设模拟一次IO行为,读取A文件一次, B文件500次, C文件500次

ioprofile  -p  pidof  io\_event -c count   # 读写次数

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

ioprofile  -p  pidof  io\_event -c times   # 读写耗时

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

ioprofile  -p  pidof  io\_event -c sizes    # 读写大小

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

iotop 和 pidstat (仅rhel6u系列)

iotop    顾名思义, io版的top

pidstat 顾名思义, 统计进程(pid)的stat,进程的stat自然包括进程的IO状况

这两个命令,都可以按进程统计IO状况,因此可以回答你以下二个问题

    1. 当前系统哪些进程在占用IO,百分比是多少?
    2. 占用IO的进程是在读?还是在写?读写量是多少?

pidstat 参数很多,仅给出几个个人习惯

pidstat -d  1                  #只显示IO

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

pidstat -u -r -d -t 1        # -d IO 信息,

# -r 缺页及内存信息
                                           # -u CPU使用率
                                           # -t 以线程为统计单位
                                           # 1  1秒统计一次

block_dump, iodump

iotop   和 pidstat 用着很爽,但两者都依赖于/proc/pid/io文件导出的统计信息, 这个对于老一些的内核是没有的,比如rhel5u2

因此只好用以上2个穷人版命令来替代:

echo 1 > /proc/sys/vm/block_dump     # 开启block_dump,此时会把io信息输入到dmesg中

# 源码: submit_bio@ll_rw_blk.c:3213

watch -n 1 “dmesg -c | grep -oP “\w+(\d+): (WRITE|READ)” | sort | uniq -c”

# 不停的dmesg -c

echo 0 > /proc/sys/vm/block_dump      # 不用时关闭

也可以使用现成的脚本 iodump, 具体参见 http://code.google.com/p/maatkit/source/browse/trunk/util/iodump?r=5389

最全的Linux教程,Linux从入门到精通

======================

  1. linux从入门到精通(第2版)

  2. Linux系统移植

  3. Linux驱动开发入门与实战

  4. LINUX 系统移植 第2版

  5. Linux开源网络全栈详解 从DPDK到OpenFlow

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

第一份《Linux从入门到精通》466页

====================

内容简介

====

本书是获得了很多读者好评的Linux经典畅销书**《Linux从入门到精通》的第2版**。本书第1版出版后曾经多次印刷,并被51CTO读书频道评为“最受读者喜爱的原创IT技术图书奖”。本书第﹖版以最新的Ubuntu 12.04为版本,循序渐进地向读者介绍了Linux 的基础应用、系统管理、网络应用、娱乐和办公、程序开发、服务器配置、系统安全等。本书附带1张光盘,内容为本书配套多媒体教学视频。另外,本书还为读者提供了大量的Linux学习资料和Ubuntu安装镜像文件,供读者免费下载。

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

本书适合广大Linux初中级用户、开源软件爱好者和大专院校的学生阅读,同时也非常适合准备从事Linux平台开发的各类人员。

需要《Linux入门到精通》、《linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

inux平台开发的各类人员。**

需要《Linux入门到精通》、《linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

<think>嗯,用户想了解Linux中的vmstat命令的用法和解读。首先,我需要回忆一下vmstat的基本功能和常用参数。vmstat主要用于监控系统的虚拟内存进程CPU活动等,能提供实时的系统性能数据。 首先,我应该先介绍vmstat的基本语法,包括命令格式和常用选项。比如,用户可能需要知道如何指定间隔时间和次数,比如`vmstat 2 5`表示每2秒刷新一次,共5次。还要提到常用选项,比如-a显示活跃和非活跃内存,-s显示内存统计摘要,-d显示磁盘统计等。 接下来需要解释输出结果各列的含义。vmstat的输出分为几个部分:进程(procs)、内存(memory)、交换区(swap)、磁盘io)、系统(system)、CPU。每个部分的字段需要详细说明,例如r表示运行队列长度,b表示等待I/O的进程数,swpd表示使用的虚拟内存量,free表示空闲内存,等等。这里要确保每个字段都解释清楚,方便用户理解当前系统状态。 然后,可能需要给出一些使用示例,比如如何监控实时状态,如何持续监控,如何结合其他工具如sar进行分析。同时,要提醒用户注意观察哪些指标,比如如果r值持续超过CPU核心数,可能表示CPU资源不足;si和so频繁变动可能说明内存不足,触发交换,影响性能。 还要考虑用户可能的进阶需求,比如如何分析瓶颈。这时候需要分CPU内存磁盘I/O几个方面来讲解。例如,如果us长期过,说明用户进程消耗大量CPU,可能需要优化程序或增加CPU资源。如果free内存持续偏低,但si/so不,可能应用本身占用过多内存。 另外,需要结合用户提供的引用内容,但看起来提供的引用和vmstat关联不大。引用[1]关于SELinux的模式切换,引用[2]是CPU频率调节,引用[3]是文件权限命令。不过用户的问题是关于vmstat,所以可能这些引用是系统自动提供的,可能不需要直接关联,除非在解释vmstat的输出时涉及到相关子系统,比如SELinux可能影响进程状态,但可能性较低。因此,可能不需要特别引用这些内容,但需要按照用户要求,在回答末尾添加引用标识。 最后,生成相关问题。根据用户提供的示例,可能需要围绕vmstat的扩展使用、结果分析、与其他工具对比、常见问题解决等来提问。比如如何诊断内存泄漏,vmstat与其他工具如top的区别,自动化监控的方法等。 需要确保回答结构清晰,分步骤说明用法、输出解读、使用示例和常见分析场景。同时使用正确的LaTeX格式,如行内公式用$...$,独立公式用$$...$$,不过vmstat可能涉及较少数学公式,但如果有性能指标的计算可能需要使用。例如,计算CPU利用率可能需要用到公式,比如$ \text{CPU空闲率} = \frac{\text{id}}{\text{us+sy+id+wa+st}} \times 100\% $,不过vmstat的输出中已经有id这一列,直接显示百分比,可能不需要公式。因此可能不需要用到数学表达式,但需遵守格式要求。 检查LaTeX语法是否正确,虽然问题可能不涉及太多数学内容,但如果有的话需正确使用。例如,如果有提到内存计算公式,可能需要用LaTeX,比如空闲内存量是$free$,总内存是$total$,则使用$free / total \times 100\%$。不过根据实际vmstat的输出,可能不需要,但需注意用户的要求。 确保使用中文回答,语言通顺,结构合理,分点讲解。最后生成的相关问题要围绕vmstat的深入使用、问题诊断、工具比较等,帮助用户进一步学习。</think>### Linux vmstat命令详解 vmstat(Virtual Memory Statistics)是Linux系统中用于监控**虚拟内存进程CPU活动**等系统资源的工具,可帮助诊断性能瓶颈。以下是使用方法和关键指标解读: --- #### 一、基本语法 ```bash vmstat [间隔时间(秒)] [刷新次数] ``` **常用选项**: - `-a`:显示活跃/非活跃内存 - `-s`:显示内存统计摘要 - `-d`:显示磁盘I/O统计 - `-w`:宽输出模式(适配宽屏) **示例**: - `vmstat 2 5`:每2秒刷新一次,共5次 - `vmstat -s`:查看内存使用汇总[^3] --- #### 二、输出字段解读 vmstat输出分为6个部分: ``` procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu----- r b swpd free buff cache si so bi bo in cs us sy id wa st ``` 1. **进程(procs)**: - `r`:**运行队列长度**(等待CPU进程数)。若长期>CPU核心数,说明CPU不足。 - `b`:**等待I/O的进程数**。持续>0可能表示I/O瓶颈。 2. **内存(memory)**: - `swpd`:已使用的虚拟内存量(单位:KB) - `free`:空闲物理内存量 - `buff/cache`:用于缓存和缓冲的内存[^1] 3. **交换区(swap)**: - `si`:每秒从磁盘加载到内存的数据量(swap-in) - `so`:每秒从内存写入磁盘的数据量(swap-out)。若`si/so`持续>0,说明物理内存不足。 4. **I/O(io)**: - `bi`:每秒从块设备接收的块数(读操作) - `bo`:每秒发送到块设备的块数(写操作) 5. **系统(system)**: - `in`:每秒中断次数(包括时钟中断) - `cs`:每秒上下文切换次数。过可能因进程频繁调度导致性能下降。 6. **CPUcpu)**: - `us`:用户进程占用CPU时间百分比 - `sy`:内核进程占用CPU时间百分比 - `id`:空闲CPU百分比 - `wa`:等待I/O的CPU时间百分比。若长期>10%,需检查磁盘性能。 --- #### 三、使用场景示例 1. **实时监控**: ```bash vmstat 1 # 每秒刷新一次 ``` 2. **内存泄漏排查**: ```bash vmstat -a 2 10 # 观察free和cache变化 ``` 3. **磁盘I/O分析**: ```bash vmstat -d # 查看bi/bo与wa指标关联性 ``` --- #### 四、性能瓶颈分析 | 指标组合 | 可能问题 | 解决方法 | |-------------------------|------------------------|------------------------------| | `r > CPU核心数` + `us` | CPU资源不足 | 优化代码/增加CPU核心 | | `b > 0` + `wa` | 磁盘I/O瓶颈 | 更换SSD/优化磁盘调度策略 | | `si/so持续>0` | 物理内存不足 | 增加内存/减少内存占用 | ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值