多核CPU调度是咋搞的?

其实很多情况下都有 这样的疑问

为什么多核CPU用着用着会“躺平”?
为什么手机有 8 核,跑分时性能却不是核心数的翻倍?

答案的钥匙,就藏在多核CPU的调度机制里。

为了更直观地理解,以一个《王者荣耀》游戏服务器为例:

  • 每个战局就是一个进程(分配独立的内存空间)。
  • 战局里的每个英雄就是一个线程(共享战局内的资源)。

进程调度:擂台系统

单核CPU

    • 像打擂台,一个时间片内只能跑一个战局,其他战局只能在旁边“候场”。
    • 时间片轮转,每个进程轮流占用 CPU 执行。

多核CPU

    • 就像增加了多个擂台,不同的战局可以同时开打。
    • 但注意:某一时刻,一个核心只能运行一个进程
    • 32核的机器看似资源丰富,但如果战局安排不好(比如线程争抢资源),性能可能会被白白浪费。

线程调度:英雄的分工

线程是更细粒度的调度单位,一个进程中的线程可以分配到多个核心并行运行。
伪代码演示:

Process game_match {
    Thread hero1; // 可能在 CPU 核心1 运行
    Thread hero2; // 可能在 CPU 核心2 运行
    Thread hero3; // 可能在 CPU 核心3 运行
}

这意味着同一个战局里的英雄可以在不同核心同时开打。但调度不当时,可能会导致英雄之间“抢蓝buff”或者“技能冷却冲突”。


现实中效率低下的原因:8核不如4核?

为什么多核CPU用起来,效率反而降低了?有几个典型场景:

线程同步开销(英雄CD等待)

多个线程需要同步共享资源,比如锁、全局变量,这些操作可能导致线程“堵塞”,无法发挥多核并行的效果。

资源竞争(抢蓝buff)

如果多个线程争抢同一个资源(比如I/O设备、内存缓存),会引发资源争用,导致性能下降。

缓存失效(切换英雄路线)

如果线程频繁迁移核心,会导致 CPU 缓存(L1/L2/L3)失效,需要重新加载数据到缓存,性能反而会大幅下降。


调度的未来

很多现在的调度系统也正试图解决上面提到的问题:

Windows 的 Thread Director 技术

    • 在混合架构(如 Intel 的 E 核+P 核)上,动态分配线程到高性能核心或高能效核心,实现性能与功耗的平衡。

Android 的 Energy Aware Scheduling(EAS)

    • 根据任务的重要性、功耗需求,智能分配线程到合适的核心上,提高电池续航。

苹果 M 芯片的异构调度

    • 将轻量任务分配到能效核心,重任务分配到性能核心,同时通过硬件加速器减轻CPU负担。

这些技术正在让多核系统的调度更高效、更智能,最大化性能的同时,降低功耗。


调度之道,如同太极

“看似繁杂的切换,暗含天地至理;貌似混乱的调度,实则蕴藏大智。”

多核调度并不是一场“蛮力竞赛”,它的艺术在于找到性能、功耗、复杂性之间的最佳平衡点。

制作不易,如有帮助,记得点赞关注哦~ 我是旷野,探索无尽技术!

光电经纬仪是最早、最广泛应用于飞行器测控领域的光电跟踪测量设备,它 的组成部分包括大地测量光学经纬仪、激光跟踪测量系统、微机控制系统与图像 处理系统组成。光电经纬仪通过记录飞行过程中的目标图像,并测量传动机架的 角度,从而获得目标飞行参数,它在飞行实况记录中发挥重要的作用 [1] 。此外, 它还可以实现迅速定位目标位置和自动跟踪高速目标,已被广泛地应用于诸如航 天发射、飞行器测控等光电测量领域 [1] 。 随着数字图像处理等技术的发展,光电经纬仪由胶片式成像向数字式成像转 变。此外,高帧速率、高分辨率成像传感器技术已被广泛应用于光电经纬仪。这 些给光电经纬仪实时图像处理平台的发展带来新的挑战:复杂图像处理算法的实 现和数据吞吐量的巨大需求 [1-2] 。 DSP 作为一种密集型数据运算与实时信号处理的微处理器,能够很好的满足 复杂图像处理算法、实时性处理的需求。DSP 技术经过多年的发展,被广泛应用 在信号、图像、通信等技术领域,尤其是高性能计算、高速实时图像处理、超大 数据量处理的军用电子领域 [2] 。现今的图像处理平台由于芯片单片运算能力受到 限制,绝大部分使用了多个 DSP + FPGA 的架构,才能勉强实现实时图像处理任 务 [3] 。但是这样的平台带来的困难是显而易见的: 1. 系统结构复杂。采用多片 DSP+FPGA 的架构,系统的整体处理性能受片 间(DSP 与 FPGA 之间、DSP 与 DSP 之间)通信带宽瓶颈而下降。 2. 系统功耗大。多片 DSP 在单块电路板上的集成度越高,带来了单板整体 功耗的增加和散热的问题,导致单板多片 DSP 整体处理性能的可靠性和稳定性。 3. 系统调试困难。由于系统结构的复杂,导致系统的调试异常的困难。芯 片之间的任务分配、数据传输、并行处理非常复杂,使得产品在设计、调试、生 产阶段的难度加大。 本文研究的课题来源于光电经纬仪图像处理平台由多片 DSP 架构升级到多 核 DSP 架构而提出的系统应用需求。结合实验室的项目情况,本文将重点放在 多核 DSP 并行的以下相关技术: 1. DSP+FPGA 架构下图像数据流的设计。光电经纬仪的图像处理系统需要 兼容前端的多种图像输入格式,包括 CameraLink、SDI 以及光纤接口,DSP+FPGA载板搭配不同的子板就可以实现输入的灵活性;此外,DSP+FPGA 图像处理系 统中的高速 SRIO 接口用于图像数据通信。本文在 CameraLink 和 SRIO 这两个关 键接口做了一定的研究工作。 2. 多核环境下并行访问共享/外部存储器的性能研究和设计原则分析。多核 DSP 中存在多个主设备,包括多个 DSP 内核、多个 EDMA 设备等,它们并行访 问存储器的数据带宽,对于应用程序存储资源的安排、软件结构的设计是至关重 要的。 3. 多核 DSP 并行调度方案的研究。多核 DSP 图像处理平台,一方面要实 现复杂的图像处理算法,另一方面要满足超大运算量对实时性处理的需求。基于 多核的系统应用开发关键的一步,就是选择合适的处理模型实现任务并行调度。 本文将介绍多核 DSP 并行调度的几种方案,并以算法实例对主从模型进行分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值