✍个人博客:Pandaconda-优快云博客
📣专栏地址:http://t.csdnimg.cn/UWz06
📚专栏简介:在这个专栏中,我将会分享 Golang 面试中常见的面试题给大家~
❤️如果有收获的话,欢迎点赞👍收藏📁,您的支持就是我创作的最大动力💪
166. 什么是 Go 抢占式调度?
在 1.2 版本之前,Go 的调度器仍然不支持抢占式调度,程序只能依靠 Goroutine 主动让出 CPU 资源才能触发调度,这会引发一些问题,比如:
- 某些 Goroutine 可以长时间占用线程,造成其它 Goroutine 的饥饿。
- 垃圾回收器是需要 stop the world 的,如果垃圾回收器想要运行了,那么它必须先通知其它的 goroutine 停下来,这会造成较长时间的等待时间。
为解决这个问题:
- Go 1.2 中实现了基于协作的“抢占式”调度。
- Go 1.14 中实现了基于信号的“抢占式”调度。
167. 基于协作的抢占式调度如何实现?
协作式:大家都按事先定义好的规则来,比如:一个 goroutine 执行完后,退出,让出 p,然后下一个 goroutine 被调度到 p 上运行。这样做的缺点就在于是否让出 p 的决定权在 groutine 自身。一旦某个 g 不主动让出 p 或执行时间较长,那么后面的 goroutine 只能等着,没有方法让前者让出 p,导致延迟甚至饿死。
非协作式: 就是由 runtime 来决定一个 goroutine 运行多长时间,如果你不主动让出,对不起,我有手段可以抢占你,把你踢出去,让后面的 goroutine 进来运行。
基于协作的抢占式调度流程:
- 编译器会在调用函数前插入 runtime.morestack,让运行时有机会在这段代码中检查是否需要执行抢占调度。
- Go 语言运行时会在垃圾回收暂停程序、系统监控发现 Goroutine 运行超过 10ms,那么会在这个协程设置一个抢占标记。
- 当发生函数调用时,可能会执行编译器插入的 runtime.morestack,它调用的 runtime.newstack 会检查抢占标记,如果有抢占标记就会触发抢占让出 cpu,切到调度主协程里。
这种解决方案只能说局部解决了 “饿死” 问题,只在有函数调用的地方才能插入 “抢占” 代码(埋点),对于没有函数调用而是纯算法循环计算的 G,Go 调度器依然无法抢占。
比如,死循环等并没有给编译器插入抢占代码的机会,以下程序在 go 1.14 之前的 go 版本中,运行后会一直卡住,而不会打印 I got scheduled!。
package main
import (
"fmt"
"runtime"
"time"
)
func main() {
runtime.GOMAXPROCS(1)
go func() {
for {
}
}()
time.Sleep(time.Second)
fmt.Println("I got scheduled!")
}
为了解决这些问题,Go 在 1.14 版本中增加了对非协作的抢占式调度的支持,这种抢占式调度是基于系统信号的,也就是通过向线程发送信号的方式来抢占正在运行的 Goroutine。
168. 基于信号的抢占式调度如何实现?
真正的抢占式调度是基于信号完成的,所以也称为 “异步抢占”。不管协程有没有意愿主动让出 cpu 运行权,只要某个协程执行时间过长,就会发送信号强行夺取 cpu 运行权。
- M 注册一个 SIGURG 信号的处理函数:sighandler。
- sysmon 启动后会间隔性的进行监控,最长间隔 10ms,最短间隔 20us。如果发现某协程独占 P 超过 10ms,会给 M 发送抢占信号。
- M 收到信号后,内核执行 sighandler 函数把当前协程的状态从 _Grunning 正在执行改成 _Grunnable 可执行,把抢占的协程放到全局队列里,M 继续寻找其他 goroutine 来运行。
- 被抢占的 G 再次调度过来执行时,会继续原来的执行流。
抢占分为 _Prunning 和 _Psyscall,_Psyscall 抢占通常是由于阻塞性系统调用引起的,比如磁盘 io、cgo。_Prunning 抢占通常是由于一些类似死循环的计算逻辑引起的。