不要以共享内存的方式来通信,相反,要通过通信来共享内存
Go语言的并发模型参考的是CSP理论(Go推荐的,通信顺序进程,一种并发编程模型),另一种就是多线程共享内存,在访问共享数据时,通过锁来访问,因此衍生出了许多方便的数据结构,叫做“线程安全的数据结构”。
Go的CSP并发模型
CSP = goroutine + Channel
Goroutine
实际并发执行的实体,它底层是使用协程(coroutine)实现并发,coroutine是一种运行在用户态的用户线程,go底层选择使用coroutine的出发点是因为,它具有以下特点:
用户空间 避免了内核态和用户态的切换导致的成本(只需要上下文切换,即改动寄存器值)
可以由语言和框架层进行调度
更小的栈空间允许创建大量的实例(线程栈空间通常2M,协程2K)
而goroutine是在golang层面提供了调度器(用户控制调度),并且对网络IO库进行了封装,屏蔽了复杂的细节,对外提供统一的语法关键字支持,简化了并发程序编写的成本
channel
它是被单独创建并且可以在进程之间传递,一个实体通过将消息发送到channel 中,然后又监听这个 channel 的实体处理,两个实体之间是匿名的,这个就实现实体中间的解耦,其中 channel 是同步的一个消息被发送到 channel 中,最终是一定要被另外的实体消费掉的。
协程调度策略GPM
组成:Goroutine + Procesor + Machine + sched
G:Goroutine(G结构体,包含运行堆栈,状态及任务函数,需要绑定到P上才能被调用执行)
P:Procesor(调度处理器, P为M提供了执行G的环境,GoMAXPROCS决定他的数量,最大为256)
M:Machine(内核线程,不会很多(10000,减少操作系统上的调度负载),绑定有效的P后,进入schedule循环(调度循环),机制就是从P的Local队列获取G,完了从Sched的全局队列获取G,完了从其他P处抢G来执行。M上不存G的状态,这也是G可以跨M调度的基础)
Sched:调度器(存有全局队列,空闲M\P等)
策略:
1,减少阻塞(协程让出主动):
P里面会维护一个最小堆,里面记录很多timer,时间到时通知挂起的(GRunning->GWaiting)G恢复到GRunnable状态并放回到Local队列中去。另外还有一层保障(防止M都在忙,timer没被检查):监控线程(主线程创建,循环执行任务,其中包括检查timer)
场景1(网络请求和IO操作导致G阻塞从而阻塞M),Go提供了网络轮询器(epoll实现IO多路复用)来处理,使用网络轮询器进行异步网络系统调用,完成后放回全局队列。
场景2:channel读写阻塞,channel的读写列表会记录阻塞的G,等到可读/可写,或者channel关闭,会通知到G回到等待状态让出。
2,任务窃取(抢占):抢其他P的G(设置stackPreempt(栈增长)和异步抢占(发信号));
硬核文章视频:
https://www.bilibili.com/video/BV1Ky4y1r78H