一文吃透Linux系统性能调优技巧

七夜zippoe

已于 2025-01-09 13:56:39 修改

阅读量928

点赞数 24

分类专栏： Linux 文章标签： linux 性能优化调试技巧

于 2025-01-09 13:56:17 首次发布

本文链接：https://blog.youkuaiyun.com/sinat_41617212/article/details/145032005

版权

Linux 专栏收录该内容

14 篇文章

订阅专栏

一、性能调优前奏：明确目标与工具

1.1 定目标：找准性能提升方向

在开启 Linux 系统性能调优之旅前，明确调优目标宛如点亮前行的灯塔，至关重要。不同的应用场景对系统性能有着各异的侧重点，例如对于在线交易系统，快速的响应时间是关键，关乎用户下单的流畅体验，稍有延迟都可能导致客户流失；而对于数据存储和分析的服务器，高效的磁盘 I/O 以及充足的内存则是保障大数据快速读写与处理的核心要素。倘若系统出现响应迟缓，像是用户操作后长时间等待反馈，或者资源利用率持续偏高，如 CPU 长时间满载运行等状况，那就表明迫切需要进行性能调优了。通过精准定位这些问题表象，进一步深挖背后的根源，才能让调优有的放矢，切实提升系统性能。

1.2 选工具：精准 “把脉” 系统状态

工欲善其事，必先利其器。在 Linux 系统性能调优的征程中，一系列强大的性能监控工具宛如医生手中的听诊器、体温计，能助我们精准洞察系统的运行状态。

top 命令，堪称系统性能监控的得力先锋，输入 “top” 后，系统关键信息尽收眼底。实时展示的 CPU 使用率，能直观反映当前系统计算任务的繁忙程度；内存占用情况，让我们知晓内存资源的分配与剩余；还有各个进程的资源占用详情，犹如一份详细的任务清单，助您迅速揪出 “资源大户”。

htop 则是 top 的进阶加强版，界面更为友好、直观。它以色彩区分不同资源类型，进程信息的展示也更为丰富，还支持鼠标操作，交互性满分，让您在查看系统状态时如同浏览精心设计的图表，轻松惬意。

vmstat 犹如一位严谨的系统体检师，全面汇报内存、I/O、CPU 的各项统计信息。从虚拟内存的使用趋势，到磁盘 I/O 的繁忙程度，再到 CPU 的忙碌比例，为您勾勒出系统运行的全景图，助您发现潜在问题。

iostat 专注于磁盘 I/O 性能监控，是解决磁盘瓶颈的利器。运行 “iostat -x 1”，每秒更新一次磁盘 I/O 详细状态，% util 指标若接近 100%，那便是磁盘即将 “告急” 的红灯警示，await 平均等待时间越短，磁盘响应越迅速。

sar 如同系统的 “史官”，长期收集、记录系统活动信息，生成周期性报告。无论是 CPU 使用率的历史波动，还是内存占用的时段变化，都能清晰回溯，为性能分析提供长期视角，助您把握系统性能的变化脉络。

netstat 宛如网络世界的侦探，查看网络连接、路由表、接口统计等信息手到擒来。通过它，您能洞悉网络连接的状态，排查网络异常，是保障网络顺畅的关键助手。

perf 是 CPU 性能剖析的专家，深入挖掘 CPU 性能瓶颈。“perf top” 命令下，系统运行热点函数、代码段一目了然，让 CPU 耗时操作无处遁形，为针对性优化指引方向。这些工具各有所长，熟练运用它们，方能在性能调优之路上精准发力，让 Linux 系统重回高效运行的巅峰状态。

二、CPU 调优：释放核心潜能

2.1 优化亲和性：减少切换损耗

CPU 亲和性，简单来说，就是进程与特定 CPU 核心之间的 “亲密程度”。在多核处理器的 Linux 系统中，默认情况下进程可能会在不同 CPU 核心间频繁切换，如同一个忙碌的工人不断在各个车间游走，这带来的上下文切换开销不容小觑，会消耗大量 CPU 时间。而合理设置 CPU 亲和性，就像是为进程指定专属 “工作车间”，让它能稳定地在固定 CPU 核心上运行。

以 taskset 命令为例，若要将一个正在运行的进程（假设进程 ID 为 1234）绑定到 CPU 0 上，只需在终端输入 “taskset -p 0x1 1234”，其中 0x1 是十六进制表示的 CPU 掩码，对应二进制的 0001，意味着仅启用 CPU 0。如此一来，该进程后续的所有任务都将在 CPU 0 上执行，避免了跨核心切换带来的额外损耗，大大提升运行效率。若您正在运行一个对实时性要求极高的音频处理程序，将其进程绑定到单独的 CPU 核心，能有效杜绝因切换导致的音频卡顿，让声音流畅输出。

2.2 调度策略：适配任务类型

Linux 系统为我们准备了多种 CPU 调度策略，各有千秋，以应对不同特性的任务。

SCHED_OTHER，这是大多数普通进程所采用的默认调度策略，秉持公平原则，让每个进程都能雨露均沾地获取 CPU 时间片，确保系统整体平稳运行，适用于像文本编辑器这类对响应及时性要求不特别高、偶尔才需要 CPU 处理的常规应用程序。

SCHED_FIFO 则大不相同，它遵循先进先出且无时间片轮转机制，高优先级进程一旦占据 CPU，便会持续运行，直到主动让出 CPU（如等待 I/O 操作时）或被更高优先级进程抢占。想象一下在工业自动化控制系统中，实时采集传感器数据并即刻处理的进程，就需要这种高优先级保障，避免数据积压延误，确保系统实时响应。

SCHED_RR 像是 SCHED_FIFO 的改良版，引入了时间片轮转。相同优先级的进程轮流在 CPU 上运行一段固定时间片，防止某个进程独占资源过长时间。在多任务实时处理场景，如同时处理多个网络视频流的服务器，既能保证实时性，又兼顾公平，让各个视频流的处理都能有序推进。

借助 chrt 命令，我们可以灵活调整进程的调度策略与优先级。若要以 SCHED_FIFO 策略启动一个新进程，优先级设为 50，执行 “chrt -f -p 50 command” 即可（这里 “command” 指代实际要运行的程序命令）。对于正在运行的进程，比如要将其调度策略改为 SCHED_RR，优先级设为 30，可先通过 “ps -ef | grep process_name” 查到进程 ID，再运行 “chrt -r -p 30 pid” 完成设置（“process_name” 是进程名，“pid” 为进程 ID）。精准匹配任务与调度策略，如同为不同运动员安排最合适的赛道，能充分激发 CPU 潜能，让系统性能飙升。

三、内存调优：精打细算的艺术

在这里插入图片描述

3.1 掌控虚拟内存：降低 swap 依赖

虚拟内存，作为 Linux 系统中的关键机制，犹如一座连接物理内存与磁盘空间的桥梁。当物理内存告急时，系统会依据特定算法，将部分暂时不活跃的数据页面 “搬运” 到磁盘上的交换空间（swap），为急需内存资源的进程腾出空间。然而，频繁的 swap 操作恰似一场耗时的 “长途搬运”，磁盘读写速度相较于内存访问慢如蜗牛，会导致系统响应延迟飙升，性能大打折扣。

幸运的是，我们可以通过调整 swappiness 参数来掌控这一局面。swappiness 的取值范围是 0 - 100，它代表系统将内存数据置换到 swap 空间的倾向程度。以 Ubuntu 系统为例，默认 swappiness 值通常为 60，这意味着当内存紧张时，系统相对较容易启用 swap。若我们想要降低系统对 swap 的依赖，可通过编辑 /etc/sysctl.conf 文件，添加或修改 “vm.swappiness = 10”（这里将值设为 10，您可按需调整），保存后在终端运行 “sudo sysctl -p” 使配置即刻生效。如此一来，系统会更倾向于保留数据在物理内存，减少 swap 操作，让那些对响应速度要求苛刻的应用，如实时视频编辑软件，运行得更加流畅，避免因卡顿而打断创作灵感。

3.2 内存清理：为系统 “减负”

随着系统持续运行，内存中会逐渐堆积各式各样的缓存数据以及不再使用的 “杂物”，就像一间久未整理的仓库，杂乱无章且占用空间。适时清理内存，能为系统 “松绑”，释放珍贵的内存资源，使其轻装上阵。

在 Linux 系统中，有一条堪称 “清理神器” 的命令：sync; echo 3 > /proc/sys/vm/drop_caches。这条命令分两步施展 “魔法”：sync 首先登场，它如同一位严谨的管家，将内存中所有尚未写入磁盘的数据统统 “押送” 到磁盘，确保数据的完整性与安全性，避免数据丢失；紧接着，echo 3 > /proc/sys/vm/drop_caches 闪亮出击，3 这个数字是全面清理的 “密码”，它指示系统清空页面缓存、目录项缓存以及 inode 缓存，将内存中的 “垃圾” 一扫而空。不过需要注意，在执行此命令时，要确保没有关键进程正在依赖这些缓存数据，以免引发不必要的麻烦。对于长时间运行的服务器，定期（如每周一次）在系统负载较低的时段执行该命令，能有效维持系统的高效运行，避免因内存臃肿而陷入迟缓。

3.3 启用 HugePages：加速内存访问

HugePages，即大页内存，是 Linux 系统中优化内存管理的一项 “黑科技”。在传统内存管理模式下，内存被分割成众多微小的页面，当进程频繁访问内存时，CPU 需要耗费大量精力在众多微小页面的页表中 “翻找” 目标数据，就像在茫茫书海中逐页查找特定信息，效率低下。而 HugePages 则打破常规，将内存划分为尺寸更大的页面，常见的有 2MB 甚至 1GB 大小。如此一来，页表项大幅减少，CPU 在查找数据时能迅速 “定位”，极大提升内存访问效率，尤其在内存密集型应用场景，如大型数据库、虚拟化环境中，效果立竿见影。

配置 HugePages 并非难事，以 CentOS 系统为例，首先运行 “cat /proc/meminfo | grep HugePages” 查看系统当前 HugePages 配置情况，若输出中有 “HugePages_Total”“HugePages_Free” 等字段，表明系统支持 HugePages。接着，依据应用需求计算所需的 HugePages 数量，假设应用需要 4GB 大页内存，大页大小为 2MB，则数量为 4GB / 2MB = 2048。随后，编辑 /etc/sysctl.conf 文件，添加 “vm.nr_hugepages = 2048”，保存后执行 “sudo sysctl -p”，让配置生效。最后，对于像 Oracle 数据库这类应用，还需在其启动脚本中设置 “HUGETLB_MORECORE=yes” 环境变量，开启应用对 HugePages 的支持，让应用在大页内存的 “高速跑道” 上一路飞驰，显著提升性能表现。

四、磁盘 I/O 调优：打破读写瓶颈

在这里插入图片描述

4.1 调度算法抉择：适配磁盘模式

在 Linux 系统的磁盘 I/O 世界里，调度算法犹如一位幕后 “指挥官”，掌控着磁盘读写请求的处理节奏，不同的算法各有千秋，适配不同场景方能发挥最大效能。

cfq（Completely Fair Queuing），即完全公平队列算法，犹如一位严谨的资源分配者，为每个进程分配专属的 I/O 请求队列，并以时间片轮转的方式，确保每个进程都能公平地享用磁盘带宽，如同多辆车在道路上依次有序通行，避免了某个进程 “独占” 磁盘资源，适用于桌面系统以及多用户、多任务的复杂环境，像日常办公中的文档处理、网页浏览等多任务并行场景，它能保障系统整体的平稳运行，让每个任务都能及时得到磁盘响应。

deadline 则像是一位严守时间底线的调度官，基于时间的紧迫感来安排读写请求。它精心维护着两个队列：一个按扇区排序，将相邻扇区的请求集中处理，提升吞吐量；另一个按时间排序，为每个请求设定截止时间，一旦临近期限，优先处理，绝不拖延，有效避免请求 “饿死”。这种算法尤其适合高 I/O 负载的服务器，如数据库服务器，在处理海量数据读写时，确保数据能及时进出磁盘，维持数据库的高效运转，满足业务对数据时效性的严苛要求。

noop（No Operation）调度算法简单直接，如同一条畅通无阻的直通道，采用先进先出的 FIFO 队列，默认磁盘驱动或设备已对请求做好优化，自身不做过多复杂调度，最大限度减少额外开销。对于固态硬盘（SSD）这类高性能存储设备而言，noop 算法简直是绝配，因为 SSD 内部具备出色的并行处理能力和智能优化机制，无需系统层面过多干预，使用 noop 算法能让 SSD 如虎添翼，充分释放其高速读写潜能，在诸如大规模数据缓存、快速启动应用等场景中表现卓越。

以修改磁盘调度算法为 deadline 为例，操作简便易行。对于大多数 Linux 系统，只需在终端输入 “echo deadline> /sys/block/sda/queue/scheduler”（假设磁盘设备名为 sda，若不同请按需更改），即可即时将该磁盘的调度算法切换为 deadline。若期望系统重启后依然生效，对于基于 grub 引导的系统（如 CentOS、Ubuntu 等常见发行版），编辑 /etc/default/grub 文件，在 GRUB_CMDLINE_LINUX 行添加 “elevator=deadline”，保存后运行 “sudo grub2-mkconfig -o /boot/grub2/grub.cfg” 更新配置，下次重启系统，磁盘便会自动采用 deadline 算法，持续为高负载磁盘读写任务保驾护航。

4.2 缓存策略调整：加速磁盘读写

磁盘缓存，作为提升磁盘读写性能的关键 “润滑剂”，能大幅减少磁盘实际物理读写次数，降低延迟。hdparm 工具则是操控磁盘缓存策略的得力助手，以开启磁盘写缓存为例，展现其强大 “魔力”。

在终端输入 “sudo hdparm -W1 /dev/sda”（同样，/dev/sda 依实际磁盘设备名而定），这条命令便是开启磁盘写缓存的 “魔法咒语”。一旦启用，系统在执行写操作时，数据不会立即被 “推送” 到磁盘的物理存储区域，而是先暂存于高速缓存区，如同快递包裹先集中存放在本地中转站。后续磁盘空闲或满足特定触发条件时，再批量写入磁盘，避免频繁的零碎写入，极大提升写操作效率。就像在持续大量写入数据的场景，如日志记录服务器，开启写缓存后，能显著加快数据写入速度，确保日志信息及时保存，同时减轻磁盘繁忙程度。不过，凡事皆有两面性，开启写缓存虽带来性能提升，但也伴随着一定风险，如系统突然断电或崩溃时，缓存中尚未写入磁盘的数据可能会丢失，因此在对数据安全性要求极高的场景，需谨慎权衡利弊，或结合诸如不间断电源（UPS）、数据备份等措施保障数据安全。

4.3 RAID 优化升级：强化存储效能

对于采用 RAID（Redundant Arrays of Independent Disks，独立磁盘冗余阵列）配置的系统而言，合理优化能让其存储效能更上一层楼，为数据的读写开辟高速通道。

以常见的软件 RAID 为例，stripe_cache_size 参数宛如一个调控数据 “流速” 的阀门，掌控着 RAID 阵列中数据条带在缓存中的暂存与流动。增大这个参数值，意味着为数据读写开辟了更宽敞的 “缓存高速路”，能显著提升 RAID 的写性能。比如在数据密集型的存储服务器中，运行 “sudo echo 32768 > /sys/block/md0/md/stripe_cache_size”（假设 RAID 设备名为 md0，根据实际情况调整），将 stripe_cache_size 设为 32768（单位通常为字节，可依磁盘性能、应用需求灵活调配），系统在处理大量顺序写入任务，如视频素材批量存储、大数据集持续录入时，能让数据更高效地在磁盘阵列间穿梭，减少等待时间，充分发挥 RAID 并行读写的优势，实现存储性能的飞跃。但调整此参数时，需密切关注系统内存使用情况，避免因过度分配缓存导致内存紧张，引发系统性能波动，确保在提升存储效能的同时，维持系统整体的稳定运行。

五、网络性能调优：畅通数据通道

在这里插入图片描述

5.1 TCP 缓存调优：适应网络场景

在 Linux 系统的网络世界里，TCP 缓存宛如一个 “数据缓冲池”，对网络传输性能有着举足轻重的影响。当接收端与发送端的处理速度存在差异，或者网络出现短暂拥塞时，这个缓冲池便能发挥关键作用，避免数据丢失，确保传输的连贯性。

调整 TCP 缓存大小，能让网络传输更加顺畅高效。以提升高延迟、高带宽网络中的传输速度为例，我们可以通过一系列命令来优化缓存设置。首先，“sudo sysctl -w net.core.rmem_max=26214400” 用于增大接收 TCP 缓存的最大值，确保接收端有足够的空间容纳高速涌入的数据；“sudo sysctl -w net.core.wmem_max=26214400” 则是提升发送 TCP 缓存的最大值，让发送端能够更高效地暂存待发数据，避免因缓存不足导致发送阻塞。同时，“sudo sysctl -w net.ipv4.tcp_rmem=“10240 87380 12582912”” 以及 “sudo sysctl -w net.ipv4.tcp_wmem=“10240 87380 12582912”” 分别精细调整了接收和发送 TCP 缓存的最小值、默认值与最大值，使其能根据网络实时状况灵活适配。在跨国数据传输、大型云存储数据同步等场景中，合理配置这些参数，可显著减少因缓存问题引发的传输卡顿，让数据如丝般顺滑地在网络间流淌。

5.2 开启 TCP Fast Open：加速连接建立

TCP Fast Open（TFO）犹如一把开启网络快速通道的钥匙，打破传统 TCP 三次握手的性能瓶颈，为频繁建立连接的应用场景注入强大动力。

其原理精妙绝伦：首次连接时，客户端发送的 SYN 报文携带 Fast Open 选项且 Cookie 为空，向服务器请求 Fast Open Cookie；服务器收到请求后，生成加密的 Cookie 并置于 SYN - ACK 报文中发回客户端，客户端随即缓存该 Cookie。后续再次连接时，客户端的 SYN 报文便能 “夹带” 数据以及缓存的 Cookie 一同发送。服务器校验 Cookie 有效后，可在 SYN - ACK 报文中直接确认数据，甚至提前将数据递交给应用程序，跳过常规三次握手中等待 ACK 的环节，一举节省一个往返时间（RTT），让数据传输快人一步。

在 Linux 系统中开启这一强大功能十分便捷，只需在终端输入 “sudo sysctl -w net.ipv4.tcp_fastopen=3”，即可让系统支持客户端和服务器同时使用 TCP Fast Open。对于像网页浏览、在线游戏这类频繁发起 TCP 连接的场景，开启 TFO 后，用户能明显感受到页面加载如闪电般迅速，游戏操作响应即时灵敏，极大提升网络交互体验，让数据传输一路 “狂飙”。

六、实战调优案例：学以致用

6.1 案例背景：高并发下的困境

某互联网公司的核心业务依赖于一台运行着关键 Web 应用的 Linux 服务器，随着业务的迅猛发展，用户量与日俱增，系统逐渐不堪重负。用户频繁反馈网页加载缓慢，操作延迟严重，这对业务造成极大冲击，急需一场 “性能救赎”。

6.2 调优实战：步步为营

6.2.1 CPU 瓶颈突围

通过 top 命令观察发现，CPU 使用率长时间维持在 90% 以上，其中几个负责业务逻辑处理的进程占用大量 CPU 资源。运用 pidstat 进一步定位，确定罪魁祸首为部分未优化的后端脚本。

解决方案：利用 chrt 命令，将这些关键业务进程的调度策略调整为 SCHED_RR，优先级适当提高，确保它们能及时获取 CPU 时间片；同时，借助 taskset 把相关进程绑定到特定 CPU 核心，减少上下文切换开销。优化后，CPU 使用率降至 70% 左右，系统响应明显加快。

6.2.2 内存 “瘦身” 与优化

持续监控发现，随着系统运行，可用内存逐渐减少，swap 使用率攀升，导致频繁的磁盘交换，严重拖慢系统速度。

应对策略：编辑 /etc/sysctl.conf，将 vm.swappiness 调低至 10，减少系统对 swap 的依赖；定期在凌晨业务低谷时段执行 sync; echo 3 > /proc/sys/vm/drop_caches 清理缓存，释放内存资源。另外，依据应用内存需求，合理配置 HugePages，提升内存访问效率。经过此番调整，内存压力显著缓解，系统运行愈发流畅。

6.2.3 磁盘 I/O 困境破解

iostat 监测数据显示，磁盘 % util 接近 100%，await 时间超长，表明磁盘 I/O 已成为瓶颈，大量读写请求排队等待处理，严重影响数据存取速度。

改进措施：将磁盘调度算法切换为 deadline，通过 “echo deadline> /sys/block/sda/queue/scheduler”（假设磁盘为 sda）即时生效，确保关键读写请求能及时处理；同时，利用 hdparm -W1 /dev/sda 开启磁盘写缓存，加速写操作。针对采用 RAID 的存储阵列，增大 stripe_cache_size 参数，优化数据条带缓存。一系列操作后，磁盘 I/O 性能大幅提升，数据读写延迟明显降低。

6.2.4 网络 “加速” 行动

网络方面，用户反映数据传输慢，尤其是在高并发数据上传下载场景。通过 netstat 查看网络连接状态，发现大量 TIME_WAIT 连接占用端口资源；再借助 ss 命令观察 TCP 缓冲区使用，发现存在溢出风险。

优化手段：编辑 /etc/sysctl.conf，开启 TCP Fast Open，设置 net.ipv4.tcp_fastopen = 3，加速连接建立；精细调整 TCP 缓存参数，如 “sudo sysctl -w net.core.rmem_max=26214400” 等，适配高带宽、高延迟网络环境；同时，优化 TCP 连接回收策略，开启端口复用，减少 TIME_WAIT 连接积累。优化后，网络传输速度显著提升，数据如离弦之箭般穿梭于服务器与客户端之间。

6.3 调优成果：焕然一新

经过上述全方位的性能调优 “手术”，系统性能脱胎换骨。再次压测，在相同高并发负载下，网页平均响应时间从优化前的 5 秒锐减至 1 秒以内，吞吐量提升 3 倍有余，CPU、内存、磁盘 I/O 和网络资源使用率趋于合理稳定，成功助力业务重回高速发展快车道，为用户带来丝滑顺畅的体验。这一实战案例充分彰显了 Linux 系统性能调优的巨大威力，只要精准施策，必能挖掘系统潜能，让其绽放卓越光彩。