go的高并发原理

Go语言高并发实现原理解析

原创已于 2025-02-26 15:58:28 修改 · 1.3k 阅读

30 ·

CC 4.0 BY-SA版权

文章标签：

#golang #开发语言 #后端

于 2025-02-26 15:37:40 首次发布

golang 专栏收录该内容

11 篇文章

订阅专栏

1. 前言

Go语言由Google工程师团队于2007年开始设计，2009年正式发布。它是一门天生支持高并发的语言，那它为什么天生支持高并发呢？下面是笔者对此发表的一些见解。

2. 轻量级Goroutine

在golang中，go完全地摒弃了线程的概念，统一使用了协程。线程在操作系统中属于内核态调度单元，多线程切换涉及内核态切换，导致CPU开销较大。而协程在用户态运行，每个协程初始仅分配2KB栈空间，通过分段栈技术实现动态伸缩：
● 当检测到栈空间不足时，自动扩容2倍（最大可扩展至1GB，但实际业务场景通常小于8MB）
● 函数返回后自动缩容，避免内存浪费
这种机制使得单机轻松支撑百万级Goroutine，而Java线程数超过1万即面临OOM风险。对比其他语言的协程实现（如Java Loom的虚拟线程），Go的栈管理无需JVM的Guard Pages保护，内存利用率提升30%

3. 高效调度器GMP

3.1 浅谈GMP

g（Goroutine）：

协程，通过 go 关键字创建，是 Go 语言中的轻量级执行单位
每个 goroutine 初始分配约 2KB 栈空间，可按需扩容/缩容
包含执行上下文（PC/SP等寄存器值）、栈、状态（运行/就绪/阻塞等）

m（Machine）：

对应操作系统线程，由操作系统调度
每个 m 包含：
- 一个特殊的调度协程 g0（负责调度逻辑，64位系统默认分配 8MB 栈）
- 处理信号的协程 gsignal
在没有用户 goroutine 可执行时，m 会运行 g0 进行调度
同一时间只能运行一个 goroutine（用户 g 或 g0）

p（Processor）：

逻辑处理器，数量默认等于 GOMAXPROCS（默认为 CPU 核数）
核心调度组件，管理本地运行队列（runqueue，通常容量 256）
优化机制：
1. 当本地队列满时，会将半数 goroutine 转移到全局队列（避免全局队列锁竞争）
2. 执行时会优先从本地队列获取，其次全局队列，最后通过 work-stealing 从其他 P 窃取

3.1.1 GMP大体架构

GMP架构示意图
调度器核心运行在schedule()函数中，执行流程：

M从绑定的P本地队列获取G
本地队列空时，按优先级执行：
○ 从全局队列获取（最多取min(len(gq)/GOMAXPROCS+1, len(gq))）
○ 从网络轮询器获取已完成IO的G
○ 随机窃取其他P队列中50%的G
执行G直到触发调度点（如channel阻塞、syscall、time.Sleep等）