GM到GMP,Golang经历了什么?

Golang
399
0
0
2022-04-13

超超和面试官聊完了进程到协程发展史之后,面试官似乎想在GMP模型上对超超“痛下杀手”,下面来看超超能不能接住面试官的大杀器吧!

GM模型

面试官:你知道GMP之前用的是GM模型吗?

超超:这个我知道,在12年的go1.1版本之前用的都是GM模型,但是由于GM模型性能不好,饱受用户诟病。之后官方对调度器进行了改进,变成了我们现在用的GMP模型。

面试官:那你能给我说说什么是GM模型?为什么效率不好呢?

考点:GM模型

超超:GM模型中的G全称为Goroutine协程,M全称为Machine内核级线程,调度过程如下

图片

M(内核线程)从加锁的Goroutine队列中获取G(协程)执行,如果G在运行过程中创建了新的G,那么新的G也会被放入全局队列中。

很显然这样做有俩个缺点,一是调度,返回G都需要获取队列锁,形成了激烈的竞争。二是M转移G没有把资源最大化利用。比如当M1在执行G1时,M1创建了G2,为了继续执行G1,需要把G2交给M2执行,因为G1和G2是相关的,而寄存器中会保存G1的信息,因此G2最好放在M1上执行,而不是其他的M。

GMP

面试官:那你能给我说说GMP模型是怎么设计的吗?

考点:GMP设计

超超:G全称为Goroutine协程,M全称为Machine内核级线程,P全称为Processor协程运行所需的资源,他在GM的基础上增加了一个P层,下面我们来看一下他是如何设计的。

图片

全局队列:当P中的本地队列中有协程G溢出时,会被放到全局队列中。

P的本地队列:P内置的G队列,存的数量有限,不超过256个。这里有俩种特殊情况。一是当队列P1中的G1在运行过程中新建G2时,G2优先存放到P1的本地队列中,如果队列满了,则会把P1队列中一半的G移动到全局队列。二是如果P的本地队列为空,那么他会先到全局队列中获取G,如果全局队列中也没有G,则会尝试从其他线程绑定的P中偷取一半的G。

面试官:P和M数量是可以无限扩增的吗?

考点:GMP细节

超超:是不能无限扩增的,无限扩增系统也承受不了呀,哈哈

P的数量:由启动时环境变量$GOMAXPROCS或者是由runtime的方法GOMAXPROCS()决定。

M的数量:go程序启动时,会设置M的最大数量,默认10000。但是内核很难创建出如此多的线程,因此默认情况下M的最大数量取决于内核。也可以调用runtime/debug中的SetMaxThreads函数,手动设置M的最大数量。

面试官:那P和M都是在程序运行时就被创建好了吗?

考点:继续深挖GMP细节

超超:P和M创建的时机是不同的

P何时创建:在确定了P的最大数量n后,运行时系统会根据这个数量创建n个P。

M何时创建:内核级线程的初始化是由内核管理的,当没有足够的M来关联P并运行其中的可运行的G时会请求创建新的M。比如M在运行G1时被阻塞住了,此时需要新的M去绑定P,如果没有在休眠的M则需要新建M。

图片

面试官:你能给我说说当M0将G1执行结束后会怎样做吗?

考点:G在GMP模型中流动过程

超超:那我给你举个例子吧(:这次把整个过程都说完,看你还能问什么

图片

(图转自刘丹冰Golang的协程调度器原理及GMP设计思想)

1. 调用 go func()创建一个goroutine;

2. 新创建的G优先保存在P的本地队列中,如果P的本地队列已经满了就会保存在全局的队列中;

3. M需要在P的本地队列弹出一个可执行的G,如果P的本地队列为空,则先会去全局队列中获取G,如果全局队列也为空则去其他P中偷取G放到自己的P中

4. G将相关参数传输给M,为M执行G做准备

5. 当M执行某一个G时候如果发生了系统调用产生导致M会阻塞,如果当前P队列中有一些G,runtime会将线程M和P分离,然后再获取空闲的线程或创建一个新的内核级的线程来服务于这个P,阻塞调用完成后G被销毁将值返回;

6. 销毁G,将执行结果返回

7. 当M系统调用结束时候,这个M会尝试获取一个空闲的P执行,如果获取不到P,那么这个线程M变成休眠状态, 加入到空闲线程中。

GM与GMP

面试官:看来你对GMP整个流程还是比较清楚的,那你再给我说说GMP相对于GM做了哪些优化吧。

考点:GM与GMP区别

超超:优化点有三个,一是每个 P 有自己的本地队列,而不是所有的G操作都要经过全局的G队列,这样锁的竞争会少的多的多。而 GM 模型的性能开销大头就是锁竞争。

图片

二是P的本地队列平衡上,在 GMP 模型中也实现了 Work Stealing 算法,如果 P 的本地队列为空,则会从全局队列或其他 P 的本地队列中窃取可运行的 G 来运行(通常是偷一半),减少空转,提高了资源利用率。

图片

三是hand off机制当M0线程因为G1进行系统调用阻塞时,线程释放绑定的P,把P转移给其他空闲的线程M1执行,同样也是提高了资源利用率。

图片

面试官:你有没有想过队列和线程的优化可以做在G层和M层,为什么要加一个P层呢?

考点:深挖GMP

超超:这是因为M层是放在内核的,我们无权修改,在前面协程的问题中回答过,内核级也是用户级线程发展成熟才加入内核中。所以在M无法修改的情况下,所有的修改只能放在用户层。将队列和M绑定,由于hand off机制M会一直扩增,因此队列也需要一直扩增,那么为了使Work Stealing 能够正常进行,队列管理将会变的复杂。因此设定了P层作为中间层,进行队列管理,控制GMP数量(最大个数为P的数量)。

图片

面试官:你对GMP还是蛮了解的哈,那回到刚开始的话题,你知道mac中的回收站只能单开,访达窗口可以多开吧?

超超:知道呀,这是单例模式(:为什么mac这个点过不去了😫