Goroutine调度分析(三)

最新推荐文章于 2025-06-02 00:01:47 发布

Mr_Fogg

最新推荐文章于 2025-06-02 00:01:47 发布

阅读量745

点赞数

分类专栏： golang

golang 专栏收录该内容

12 篇文章

订阅专栏

本文探讨了Go语言调度器的早期问题及其解决方案，包括全局互斥锁的影响、goroutine交接延迟及资源消耗问题等。介绍了引入P（Processors）数据结构和work-stealing调度策略后的改进效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

上一篇文章中，大致讲了goroutine的C代码数据结构以及大致的调度策略，但是其实上一篇所提到的知识一开始go的设计，还有许多性能上的缺点。高吞吐量的其服务器以及并行运算，显示14%的的时间用在了runtime.futex()。

scheduler 的问题

一个全局的互斥锁和集中的状态。互斥锁保护goroutine的操作。
Goroutine hand-off。工作线程经常之间传递runnable goroutine，这会导致延迟增加，和资源消耗。
每一个M都有mcache。其实只有正在运行goroutine的M才需要用到mcache（一个因为系统调用阻塞的M的并不需要mcache)。通常来说跑G code的M和所有的M的数量比有1：100，或者更大。这就导致过多的资源消耗(每一个Mcache占用炒作2MB)。和很差的data locality.
过多的线程blocking/unblocking。

设计改进

大致上来说就是增加一个P(Processors)数据结构并且实现一个work-stealing scheduler。
M代表OS线程，P代表一个需要执行Go的资源。当M执行Go code，它必须有一个P。若M是空闲的或者进入系统调用，它也需要P。
确切来讲，总共有GOMAXPROCS 个P。所有的P被组成一个数组，这是work-stealing的要求。一些变量从sched移动到P。一些变量也从M移动到P(一些跟激活go code执行相关的变量)。P数据结构如下图
这里写图片描述
当一个M准备要执行Go code时，它必须从list中pop一个P。当执行完Go code时，它必须将它的P push到list中。所有当M执行Go code，它必须有一个P。

调度

当新的G被创建或者一个G编程runnable状态。它会被push到当前执行的P。当P执行完一个G，它会先尝试从自己list中pop一个runnable G。如果list是空的，则P选择一个随机的P(不包括自己)，且尝试偷一半的runnable goroutine过来。

系统调用/ M Parking 和 Unparking

当M创建一个新的G，必须要保证有一个其他M来执行这个G。类似的，当M进入系统调用，它必须保证有一个其他的M来执行Go code。
这里有两个选择，一个是block 或unblock M，一个是实现spinning(自旋)。这里有一个性能和消耗不必要CPU周期的冲突。这里的idea是用spinning并且需要消耗cpu周期。尽管如此，当GOMAXPROCES=1时，二者是没有区别的。
Spinning有两个阶段：(1)当有P资源的空闲M寻找新的G （2）当M没有P资源等待可用的P资源时。这里至多有GOMAXPROCS spinning的M。当有空闲的type(2)造成的空前M时，type(1)产生的M不会阻塞。当有一个G被创建时，或者M进入了系统调用，或M从空闲转为忙碌，它会保证至少有一个spinningM。这就保证了没有runnable goroutine会被执行，并且避免了过多的blocking/unblocking