第1讲：Go调度器GMP模型深度解析

最新推荐文章于 2025-12-22 16:59:18 发布

earthzhang2021

最新推荐文章于 2025-12-22 16:59:18 发布

阅读量233

点赞数 5

CC 4.0 BY-SA版权

分类专栏： GO语言高级编程文章标签： golang 开发语言后端数据结构算法

本文链接：https://blog.youkuaiyun.com/earthzhang2021/article/details/153401553

GO语言高级编程专栏收录该内容

7 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

一、为什么需要调度器？

大家好！今天我们来深入探讨Go语言最核心的特性之一——goroutine调度器。想象一下，如果让你在单核CPU上同时运行成千上万个任务，你会怎么做？这就是Go调度器要解决的问题。

传统操作系统线程虽然强大，但创建成本高（通常1-2MB栈内存），上下文切换开销大。而goroutine非常轻量（初始仅2KB），创建快速，切换成本低。但如何高效地管理这么多goroutine呢？答案就是GMP模型。

二、GMP模型的核心组成

2.1 三个关键角色

G (Goroutine)：我们编写的go func()就是创建一个G。它包含执行代码、栈空间、状态等信息。

M (Machine)：代表真正的操作系统线程。M负责执行G的代码，与内核线程一一对应。

P (Processor)：调度器的处理器，可以看作是M执行G所需的上下文环境。P的数量默认等于CPU核心数。

2.2 它们之间的关系

让我用一个生活中的比喻来解释：

G 就像工厂里的生产任务
M 就像生产线上的工人
P 就像工人的工作台，上面放着待处理的任务

一个工人(M)需要有一个工作台(P)才能干活，工作台上放着多个待处理的任务(G)。工人每次从自己的工作台上取一个任务来执行。

三、调度器的核心工作原理

3.1 工作窃取（Work Stealing）

当某个P的本地队列没有G时，它不会闲着，而是会：

先从全局队列获取G
如果全局队列为空，会从其他P的本地队列"偷"一半的G过来

这种机制确保了所有CPU核心都能充分忙碌。

3.2 调度时机

调度器在以下时机可能发生调度：

主动让出：调用runtime.Gosched()
系统调用：如文件I/O、网络请求
通道操作：阻塞的通道发送/接收
垃圾回收：GC需要暂停所有goroutine
时间片用完：默认10ms

四、深入代码理解GMP

让我们通过代码来实际观察GMP的行为：

package main

import (
    "fmt"
    "runtime"
    "sync"
    "time"
)

func printGMPInfo() {
    // 获取GMP数量信息
    fmt.Printf("CPU核心数: %d\n", runtime.NumCPU())
    fmt.Printf("GOMAXPROCS: %d\n", runtime.GOMAXPROCS(0))
    fmt.Printf("当前goroutine数量: %d\n", runtime.NumGoroutine())
}

func demonstrateWorkStealing() {
    fmt.Println("\n=== 工作窃取演示 ===")
    
    // 设置使用2个P，便于观察工作窃取
    runtime.GOMAXPROCS(2)
    
    var wg sync.WaitGroup
    totalTasks := 10
    
    // 创建不平衡的任务分布
    for i := 0; i < totalTasks; i++ {
        wg.Add(1)
        go func(taskID int) {
            defer wg.Done()
            
            // 模拟计算工作
            sum := 0
            for j := 0; j < 1000000; j++ {
                sum += j
            }
            
            // 获取当前goroutine ID（近似）
            fmt.Printf("任务 %d 完成, 当前goroutine数量: %d\n", 
                taskID, runtime.NumGoroutine())
        }(i)
    }
    
    wg.Wait()
}

运行这个程序，你会看到任务是如何在不同P之间被调度执行的。

五、系统调用与网络轮询器

当goroutine执行系统调用（如文件读写、网络请求）时，调度器会进行特殊处理：

package main

import (
    "fmt"
    "net/http"
    "runtime"
    "sync"
    "time"
)

func systemCallDemo() {
    fmt.Println("\n=== 系统调用处理演示 ===")
    
    startGoroutines := runtime.NumGoroutine()
    fmt.Printf("开始前goroutine数量: %d\n", startGoroutines)
    
    var wg sync.WaitGroup
    urls := []string{
        "http://httpbin.org/delay/1",
        "http://httpbin.org/delay/2",
        "http://httpbin.org/delay/1",
    }
    
    for i, url := range urls {
        wg.Add(1)
        go func(id int, u string) {
            defer wg.Done()
            
            // 网络请求是系统调用，会触发调度
            start := time.Now()
            _, err := http.Get(u)
            if err != nil {
                fmt.Printf("请求%d失败: %v\n", id, err)
            } else {
                fmt.Printf("请求%d完成, 耗时: %v\n", id, time.Since(start))
            }
        }(i, url)
    }
    
    // 监控goroutine数量变化
    go func() {
        for i := 0; i < 6; i++ {
            time.Sleep(300 * time.Millisecond)
            fmt.Printf("监控 - goroutine数量: %d\n", runtime.NumGoroutine())
        }
    }()
    
    wg.Wait()
    fmt.Printf("结束后goroutine数量: %d\n", runtime.NumGoroutine())
}

关键点：当G进行系统调用时，M会被阻塞，但P不会被阻塞。调度器会将P与M分离，然后为P分配一个新的M来执行其他G。当系统调用完成后，G会尝试获取P继续执行，如果获取不到则加入全局队列。

六、实战：构建高性能并发处理器

下面我们构建一个实用的任务处理器，展示如何在实际项目中应用GMP知识：

package main

import (
    "fmt"
    "log"
    "math/rand"
    "runtime"
    "sync"
    "sync/atomic"
    "time"
)

// 任务类型
type TaskType int

const (
    CPUTask TaskType = iota
    IOTask
    MixedTask
)

// 任务结构
type Task struct {
    ID       int
    Type     TaskType
    Data     string
    Priority int
}

// 任务处理器
type TaskProcessor struct {
    taskQueue   chan Task
    workerCount int
    // 统计信息
    totalProcessed int64
    cpuTasks       int64
    ioTasks        int64
    mixedTasks     int64
    // 控制
    wg      sync.WaitGroup
    stopChan chan struct{}
}

// 新建任务处理器
func NewTaskProcessor(workerCount, queueSize int) *TaskProcessor {
    return &TaskProcessor{
        taskQueue:   make(chan Task, queueSize),
        workerCount: workerCount,
        stopChan:    make(chan struct{}),
    }
}

// 启动处理器
func (tp *TaskProcessor) Start() {
    log.Printf("启动任务处理器, Workers: %d, QueueSize: %d", 
        tp.workerCount, cap(tp.taskQueue))
    log.Printf("GOMAXPROCS: %d", runtime.GOMAXPROCS(0))
    
    for i := 0; i < tp.workerCount; i++ {
        tp.wg.Add(1)
        go tp.worker(i)
    }
    
    log.Printf("所有worker已启动, 当前goroutine数量: %d", runtime.NumGoroutine())
}

// worker处理任务
func (tp *TaskProcessor) worker(id int) {
    defer tp.wg.Done()
    
    log.Printf("Worker %d 开始运行", id)
    
    for {
        select {
        case task := <-tp.taskQueue:
            tp.processTask(id, task)
        case <-tp.stopChan:
            log.Printf("Worker %d 收到停止信号", id)
            return
        }
    }
}

// 处理单个任务
func (tp *TaskProcessor) processTask(workerID int, task Task) {
    start := time.Now()
    
    switch task.Type {
    case CPUTask:
        atomic.AddInt64(&tp.cpuTasks, 1)
        tp.simulateCPUWork(task)
    case IOTask:
        atomic.AddInt64(&tp.ioTasks, 1)
        tp.simulateIOWork(task)
    case MixedTask:
        atomic.AddInt64(&tp.mixedTasks, 1)
        tp.simulateMixedWork(task)
    }
    
    atomic.AddInt64(&tp.totalProcessed, 1)
    duration := time.Since(start)
    
    log.Printf("Worker %d 完成任务 %d (类型: %v), 耗时: %v, 活跃goroutines: %d",
        workerID, task.ID, task.Type, duration, runtime.NumGoroutine())
}

// 模拟CPU密集型工作
func (tp *TaskProcessor) simulateCPUWork(task Task) {
    // 模拟复杂计算
    result := 0
    for i := 0; i < 5000000; i++ {
        result += i * i
        if i%1000000 == 0 {
            // 偶尔检查是否需要停止
            select {
            case <-tp.stopChan:
                return
            default:
            }
        }
    }
    _ = result // 防止编译器优化
}

// 模拟I/O密集型工作
func (tp *TaskProcessor) simulateIOWork(task Task) {
    // 模拟网络或磁盘I/O
    ioTime := time.Duration(100+rand.Intn(200)) * time.Millisecond
    select {
    case <-time.After(ioTime):
    case <-tp.stopChan:
        return
    }
}

// 模拟混合型工作
func (tp *TaskProcessor) simulateMixedWork(task Task) {
    // 第一阶段：CPU计算
    result := 0
    for i := 0; i < 2000000; i++ {
        result += i * i
    }
    
    // 第二阶段：I/O等待
    select {
    case <-time.After(50 * time.Millisecond):
    case <-tp.stopChan:
        return
    }
    
    // 第三阶段：更多计算
    for i := 0; i < 1000000; i++ {
        result += i
    }
    _ = result
}

// 提交任务
func (tp *TaskProcessor) SubmitTask(task Task) bool {
    select {
    case tp.taskQueue <- task:
        return true
    case <-time.After(100 * time.Millisecond):
        log.Printf("任务 %d 提交超时 (队列可能已满)", task.ID)
        return false
    }
}

// 停止处理器
func (tp *TaskProcessor) Stop() {
    log.Println("停止任务处理器...")
    close(tp.stopChan)
    tp.wg.Wait()
    log.Println("任务处理器已停止")
}

// 获取统计信息
func (tp *TaskProcessor) GetStats() string {
    total := atomic.LoadInt64(&tp.totalProcessed)
    cpu := atomic.LoadInt64(&tp.cpuTasks)
    io := atomic.LoadInt64(&tp.ioTasks)
    mixed := atomic.LoadInt64(&tp.mixedTasks)
    
    return fmt.Sprintf(
        "任务统计:\n"+
            "总处理数: %d\n"+
            "CPU任务: %d\n"+
            "I/O任务: %d\n"+
            "混合任务: %d\n"+
            "当前goroutines: %d",
        total, cpu, io, mixed, runtime.NumGoroutine())
}

// 监控器
func (tp *TaskProcessor) StartMonitor() {
    go func() {
        ticker := time.NewTicker(5 * time.Second)
        defer ticker.Stop()
        
        for {
            select {
            case <-ticker.C:
                stats := tp.GetStats()
                log.Printf("监控信息:\n%s", stats)
            case <-tp.stopChan:
                return
            }
        }
    }()
}

func main() {
    fmt.Println("=== Go调度器GMP模型实战演示 ===")
    
    // 根据CPU核心数配置
    numCPU := runtime.NumCPU()
    runtime.GOMAXPROCS(numCPU)
    
    // 创建处理器：每个CPU核心2个worker，队列大小100
    processor := NewTaskProcessor(numCPU*2, 100)
    
    // 启动监控
    processor.StartMonitor()
    
    // 启动处理器
    processor.Start()
    
    // 提交测试任务
    go func() {
        time.Sleep(1 * time.Second) // 等待处理器启动
        
        log.Println("开始提交测试任务...")
        
        for i := 1; i <= 50; i++ {
            taskType := TaskType(rand.Intn(3))
            task := Task{
                ID:   i,
                Type: taskType,
                Data: fmt.Sprintf("任务数据 %d", i),
            }
            
            if !processor.SubmitTask(task) {
                // 提交失败，稍后重试
                time.Sleep(50 * time.Millisecond)
                i-- // 重试当前任务
            }
            
            // 控制提交速率
            if i%10 == 0 {
                time.Sleep(200 * time.Millisecond)
            }
        }
        
        log.Println("所有任务提交完成")
    }()
    
    // 运行一段时间后停止
    time.Sleep(30 * time.Second)
    processor.Stop()
    
    // 打印最终统计
    fmt.Println("\n=== 最终统计 ===")
    fmt.Println(processor.GetStats())
}