Go协程的底层原理(图文详解)

news/2024/5/18 18:59:44

为什么要有协程

什么是进程

![[什么是进程.png]]

  • 操作系统“程序”的最小单位
  • 进程用来占用内存空间
  • 进程相当于厂房,占用工厂空间

什么是线程

进程如果比作厂房,线程就是厂房里面的生产线:
![[什么是线程.png]]

  • 每个进程可以有多个线程
  • 线程使用系统分配给进程的内存,线程之间共享内存

CPU在线程之间来回切换:
![[cpu在线程之间来回切换.png]]

  • 线程用来占用CPU时间
  • 线程的调度需要由系统进行,开销较大
  • 线程相当于工厂的生产线,占用工人的工时
  • 线程里跑的程序就是生产流程

线程的问题

  • 线程本身占用资源大
  • 线程的操作开销大
  • 线程切换开销大

什么是协程

通过将程序的运行状态打包,使其可以在线程中调度运行多个程序:
![[协程在线程中运行图示.png]]

  • 协程就是将一段程序的运行状态打包,可以在线程之间调度
  • 将生产流程打包,使得流程不固定在生产线上
  • 协程并不取代线程,协程也需要在线程上运行
  • 线程是协程的资源,协程使用线程这个资源

协程的优势

  • 资源利用率高
  • 快速调度
  • 超高并发

总结

  • 进程用分配内存空间
  • 线程用来分配cpu时间
  • 协程用来精细利用线程
  • 协程的本质是一段包含了运行状态的程序

协程的本质

func do1() {  func2()  
}  func do2() {  func3()  // 在这里打个断点
}  func do3() {  fmt.Print("dododo")  
}  func main() {  go func1()  time.Sleep(time.Minute)  
}

运行调试,打开debugger,看输出的栈信息,协程从do1调用到do2,接下来还会调用do3,但是由于打了断点,所以do3还没有调用进来:
![[协程调用栈信息.png]]

协程在go语言的内部结构:g结构体,路径runtime/runtime2.go

type g struct {  stack       stack   // offset known to runtime/cgo
}

g结构体中的stack就是协程栈,这个协程栈就是我们上面调试输出看到的栈信息。进入stack结构体,有两个指针参数:

type stack struct {  lo uintptr  // 栈的上限hi uintptr  // 栈的下限
}

姑且先认为这个栈有两个指针,一个高指针,一个低指针,它是指向了我们栈在内存的栈区里面占用的这块内存,用来存储我们的栈帧信息。继续看g结构体里面的其它重要参数:

type g struct {  stack     stack   // offset known to runtime/cgosched     gobuf
}

还有一个叫sched的成员,类型是gobuf结构体,进入gobuf结构体,里面有两个重要的成员,一个是sp,stack pointer 栈指针,指向当前运行到的do2这个栈帧;还有一个是pc,program counter 程序计数器 记录当前程序运行到了哪行代码:

type gobuf struct {  sp   uintptrpc   uintptrg    guintptr  ctxt unsafe.Pointer  ret  uintptr  lr   uintptr  bp   uintptr // for framepointer-enabled architectures  
}

再回过头来看g结构体还有哪些重要成员,atomicstatus,这个协程的状态;goid 协程的id号:

type g struct {  stack     stack   // offset known to runtime/cgosched     gobufatomicstatus uint32 goid         int64
}

根据上面的分析,绘出协程的底层结构,协程的底层结构是一个g结构体,它里面有很多个变量,一个是stack,表示的是协程栈,指向的是stack结构体,stack里面有两个重要元素,一个是lo,指向的是协程栈的低地址,还有一个是hi,指向的是协程栈的高地址,这个栈是为了记录现在这个协程执行到哪里了。g结构体里面还有个sched的字段,这个字段是个gobuf结构体,这个结构体有两个核心的字段,一个是sp,叫栈指针,指向的是当前运行到的栈帧(目前是do2方法),还有一个是pc,叫程序计数器,记录当前程序运行到了do2中的哪行代码:
![[协程的底层结构图示.png]]

  • runtime中,协程的本质是一个g结构体
  • stack:堆栈地址
  • gobuf:目前程序运行现场
  • atomicstatus:协程状态

协程的结构我们知道了,但协程不是还要放到线程上面去执行,那go底层是如何表示线程的底层结构的呢,在runtime/runtime2.go中还有一个m的结构体,这个结构体就是用来记录操作系统线程的信息:

type m struct {  g0      *g     // 调度协程而产生的协程curg    *g     // 当前运行的协程id      int64  // 线程的idmOS            // 记录不同操作系统底层对线程的额外描述信息
}
  • runtime中将操作系统线程抽象为m结构体
  • g0:g0协程,操作调度器
  • curg:current g,目前线程运行的g
  • mOS:操作系统线程信息

协程是如何执行的

单线程循环(Go 0.x)

每个go里面的线程会从schedule()方法开始运行,schedule()方法是从g0栈上开始执行的,g0栈就是给g0这个协程在栈空间里面分配的一段内存地址,用来记录你的函数调用跳转的信息,为什么不用一个普通协程的栈记录呢,有两个原因:1.普通协程的栈只能记录业务方法的函数跳转调用信息2.当我们这个线程还没有拿到协程去运行的时候,是没有普通协程栈的。所以线程循环一开始使用的就是g0这个栈,可以理解为在内存的栈区里面有单独的一块区域用来记录线程所执行的方法。
![[单线程循环调度协程图示.png]]

这个schedule()的方法的路径是runtime/proc.go,下面简单分析下这个方法:

func schedule() {var gp *g  // 新建了一个变量叫gp,就是即将要运行的协程...        // 在全局的各种队列或本地的各种队列尝试去拿一个可以运行的协程execute(gp, inheritTime)  // 调用了execute方法
}

继续看execute方法的逻辑:

func execute(gp *g, inheritTime bool) {... // 给即将要执行的gp协程里面的一些字段赋了值gogo(&gp.sched)  // 调用了gogo方法
}

继续看gogo方法,发现只有一个函数声明:

func gogo(buf *gobuf)

凭经验可以判断出gogo方法是由汇编实现的,我们用Ctrl+Shift+F全局搜索这个gogo方法,发现每个平台都实现了对应的gogo方法,说明这个方法的逻辑是平台相关的,我们找一个runtime/asm_amd64.s文件下的gogo方法来分析:

// func gogo(buf *gobuf) 
// restore state from Gobuf; longjmp  
TEXT runtime·gogo(SB), NOSPLIT, $0-8  MOVQ   buf+0(FP), BX     // gobuf  MOVQ   gobuf_g(BX), DX  MOVQ   0(DX), CX     // make sure g != nil  JMP    gogo<>(SB)

入参传了一个gobuf指针,回顾下,gobuf结构体有两个核心的字段,一个是sp,叫栈指针,指向的是当前运行到的栈帧(目前是do2方法),还有一个是pc,叫程序计数器,记录当前程序运行到了do2中的哪行代码。继续往下看,它最后又跳转到了下面这个gogo方法,这个gogo方法里面有两个比较核心的地方:

TEXT gogo<>(SB), NOSPLIT, $0  get_tls(CX)  MOVQ   DX, g(CX)  MOVQ   DX, R14       // set the g register  MOVQ   gobuf_sp(BX), SP   // 人为插入了一个goexit方法的栈帧MOVQ   gobuf_ret(BX), AX  MOVQ   gobuf_ctxt(BX), DX  MOVQ   gobuf_bp(BX), BP  MOVQ   $0, gobuf_sp(BX)   // clear to help garbage collector  MOVQ   $0, gobuf_ret(BX)  MOVQ   $0, gobuf_ctxt(BX)  MOVQ   $0, gobuf_bp(BX)  MOVQ   gobuf_pc(BX), BX  // 将我们协程运行到了哪行代码的位置取出来 JMP    BX // 跳转到那个位置进行执行

MOVQ gobuf_sp(BX), SP:往我们的协程栈里面插入了一个栈帧,就是goexit这个方法。也就是从gogo这个方法第一次拿到了我们的普通协程栈,通过gobuf这个结构体里面指示的协程栈的高地址和低地址,它就知道了我们协程栈的范围,拿到这个协程栈后它首先将goexit这个方法的栈帧插入了进来。
MOVQ gobuf_pc(BX), BX JMP BX`:跳转到我们现场正在执行的程序计数器。

分析后逻辑就很清晰了,首先给我们的协程栈插入了一个goexit的栈帧,然后跳转到我们g结构体里面的gobuf里面的程序计数器的那一行进行执行。执行就是进入到了业务方法里面,它从do1开始执行,do1调到do2然后调到do3,它就这样执行。执行的时候用的是我们的g stack,也就是用的我们协程自己的协程栈,用自己的协程栈是为了每个g结构体记录自己的执行现场,记录自己执行到了哪个位置。然后看我们的业务代码,执行到do3打印了一条文本,然后do3要退后do2do2要退回do1,然后最终会退到goexit这个方法里面。

看下goexit这个方法的逻辑,双击shift,打开在文件中查找runtime.goexit,发现只有声明,说明是由汇编语言编写的:

func goexit(neverCallThisFunction)

每个平台都实现了对应的goexit方法,说明这个方法的逻辑是平台相关的,我们找一个runtime/asm_amd64.s文件下的goexit方法来分析:

// The top-most function running on a goroutine  
// returns to goexit+PCQuantum.  
TEXT runtime·goexit(SB),NOSPLIT|TOPFRAME,$0-0  BYTE   $0x90  // NOP  CALL   runtime·goexit1(SB)    // does not return  // traceback from goexit1 must hit code range of goexit   BYTE   $0x90  // NOP

里面比较核心的是CALL runtime·goexit1(SB)这行,它调用了runtime·goexit1这个go方法,看下这个方法的逻辑,位于runtime/proc.go中:

// Finishes execution of the current goroutine.  
func goexit1() {  mcall(goexit0) 
}

看下mcall这个方法的定义,它会切换到g0栈上执行里面的方法,后面的函数调用关系就用g0栈来记录:

// mcall switches from the g to the g0 stack and invokes fn(g)
func mcall(fn func(*g))

继续看下goexit0这个方法,里面最终会重新回到schedule()方法:

// goexit continuation on g0.  
func goexit0(gp *g) {... // 设置协程中的各项参数schedule() 
}

执行go里面的业务逻辑或业务代码都是在线程上执行的,只是说线程里面在执行一个循环,在业务方法之外也就是我们写的协程逻辑之外它是用了g0栈来记录了函数调用和跳转的关系,进入到业务方法之后,就我们写的do1调到do2然后调到do3,它使用协程自己的栈来记录函数调用和跳转的关系,这个栈里面还记录了本地临时变量,业务方法执行完成后会回退到人为强行插入的goexit这个栈帧,进入这个栈帧就会调用goexit0这个方法,他会切换到schedule,不断往复循环。
![[单线程循环抽象GM.png]]

用一个更抽象的图来表示这种过程,M用来表示系统线程的信息,G表示协程,有一个协程队列或协程池子,线程就会一个个将协程从队列里面取出来执行,执行完了后就开始寻找下一个进行执行,不断循环。这么一个单线程循环的逻辑是在0点几版的go里面实现的,当时go还没有正式发布。

多线程循环(Go 1.0)

现在的cpu都是多核多线程,应用也是多线程的应用,如果用上面的go单线程版本那也太浪费系统资源了,所以go从1.0开始引入多线程循环。以下面的两个线程为例,这两个线程执行的是一模一样的逻辑,就是走线程循环。它们会不断地从协程队列里面获取可执行协程拿过来然后送入到gogo里面去执行g协程里面的业务方法,然后再退出,退出后再从队列里面拿,循环往复。如果有8个线程的话就有8个这样的循环,不断从协程队列里面抓取可执行的协程。
![[多线程循环调度协程图示.png]]

那这样就带来一个问题,所有线程都从全局的协程队列里面去获取,就有并发问题。要保证这个协程只被抓到一个线程上面去执行,执行完成后就被丢弃,所以这个全局的协程队列需要加锁,不然业务就会产生冲突。
![[多线程循环调度协程加锁.png]]

用一个更抽象的图来表示这种过程,M用来表示系统线程,G表示协程,下面还有一个全局的队列,每个线程都要从全局的队列里面去抓取协程执行,执行完了后丢弃,再抓取一个新的,这样就会有并发问题,所以全局的协程队列需要加锁,三个线程或更多线程就要竞争这一把锁,竞争成功了就能拿到一个协程去执行:
![[多线程循环抽象GM.png]]

总结

线程循环:

  • 操作系统并不知道Goroutine的存在
  • 操作系统线程执行一个调度循环,顺序执行Goroutine
  • 调度循环非常像线程池

问题:

  • 协程顺序执行,无法并发
  • 多线程并发时,会抢夺协程队列的全局锁

总结:

  • 协程的本质时一个g结构体
  • g结构体记录了协程栈、PC信息
  • 最简情况下,线程执行标准调度循环,执行协程

G-M-P调度模型

本地队列

![[多线程一次从全局队列拿一批协程抽象图示.png]]

线程由原来一次只从全局队列拿一个协程转变为一次拿一批协程,先抓取一批放到本地队列里面执行,将本地队列里的协程执行完后再拿下一批,而从降低全局锁的冲突。

这个队列在go底层是如何表示的呢,和前面的g一样,也是一个p结构体,路径是runtime/runtime2.go,来看下它里面的重要参数:

type p struct {m        muintptr   // 指向它服务的那个线程// 它是可执行的协程的队列,可以无锁进行访问runqhead uint32  // 队列的头runqtail uint32  // 队列的尾runq     [256]guintptr  // 256长度的指针,每个指针会指向一个g结构体runnext guintptr  // 指向下一个可用的协程的指针
}

根据上面的分析,用一个图来表示p结构体,m指向它所要服务的线程,runq说明它是一个可容纳256个可执行协程的队列,runqhead指向的是队列的头,runqtail指向的是队列的尾,还有runnext指向下一个要执行的协程的地址。
![[p结构体图示.png]]

G-M-P模型

根据前面对p结构体的分析,结合前面的G和M,就凑够了G-M-P模型,每个P服务于一个M,P的职责是它要构建一个本地的协程队列,M每次要获取一个协程就直接从本地队列获取,如果M将它本地队列里的协程都执行完了,那就只能从全局队列里获取,先抢到锁,然后再拿一批到本地队列,M就又可以无锁地执行协程了。这就是最朴素最简单的G-M-P模型。
![[G-M-P模型.png]]

进一步对P的作用及底层逻辑进行分析

窃取式工作分配机制

  • M与G之间的中介(送料器)
  • P持有一些G,使得每次获取G的时候不用从全局找
  • 大大减少了并发冲突的情况

那p这部分的逻辑在go源码哪个位置体现的呢,回到前面多次提到的schedule方法,方法的路径是runtime/proc.go,他是我们线程循环的第一个方法,之前分析的时候忽略了里面大量的逻辑,其中一个逻辑就是gp,它要执行的这个协程是如何获取的:

func schedule() {var gp *g  // 新建了一个变量叫gp,就是即将要运行的协程if gp == nil {  gp, inheritTime = runqget(_g_.m.p.ptr())  }
}

如果前面没有拿到要执行的这个协程,就执行了一个runqget的方法,意思是通过可执行队列获取一个协程,先看下它的入参,_g_是我们现在正在运行的这个协程,也就是还没有切换之前,这个线程正在跑的这个协程,.m就到了我们现在的这个线程的结构体,.p就到了我们现在这个线程对应的本地队列,然后取了它的指针。传入到了runqget中。看下runqget的逻辑,正常情况下nextrunnext,runnext指向的是下一个可执行的协程,这里将这个地址取了出来然后return了回去:

func runqget(_p_ *p) (gp *g, inheritTime bool) {next := _p_.runnextif next != 0 && _p_.runnext.cas(next, 0) {  return next.ptr(), true  }
}

如果本地的队列没有了,那要从全局的队列获取一批,这个逻辑在哪里呢,回到schedule方法,继续往下看:

func schedule() {var gp *g  // 新建了一个变量叫gp,就是即将要运行的协程if gp == nil {  gp, inheritTime = runqget(_g_.m.p.ptr())  }if gp == nil {  gp, inheritTime = findrunnable()}
}

如果从本地的队列没有取到可执行的协程,它会执行findrunnable方法:

func findrunnable() (gp *g, inheritTime bool) {if sched.runqsize != 0 {  lock(&sched.lock)  gp := globrunqget(_p_, 0)  unlock(&sched.lock)  if gp != nil {  return gp, false  }  }
}

findrunnable里面如果确实从本地队列获取不到可执行的协程,它就会执行globrunqget方法,尝试从全局队列获取:

// 从全局的协程队列里拿一批协程
func globrunqget(_p_ *p, max int32) *g {}

再往回退,如果本地队列和全局队列都没有获取到可执行的协程,那是不是线程就闲着,什么也不干了,当然不是,它还能从别的地方拿到,从findrunnable中调用globrunqget方法的位置往下翻,找到下面这行代码:

gp, inheritTime, tnow, w, newWork := stealWork(now)  

点击跳转到stealWork这个方法,查看注释,意思是stealWork它的作用是从别的队列上偷一些协程过来:

// stealWork attempts to steal a runnable goroutine or timer from any P
func stealWork(now int64) (gp *g, inheritTime bool, rnow, pollUntil int64, newWork bool) {}

本地也没有,全局也没有,就只能从别的p上偷一些协程过来,进行任务窃取:
![[任务窃取1.png]]

左边这个线程的本地和全局都没有协程可获取,但是隔壁的线程对应的队列上还有,它就会偷一些过来执行,帮助隔壁的线程分担工作压力:
![[任务窃取2.png]]

窃取式工作分配机制:

  • 如果在本地或者全局队列中都找不到G
  • 去别的P中“偷”
  • 增强了线程的利用率

新建协程的放置

  • 随机寻找一个P
  • 将新协程放入P的runnect(插队)
  • 若P本地队列满,放入全局队列

go会认为你新建的这个协程优先级是最高的,尽量往前排,优先执行。这一部分的代码逻辑是在runtime/proc.gonewproc方法中,这个方法就是用来新建协程:

func newproc(fn *funcval) {newg := newproc1(fn, gp, pc)  // 新建一个协程_p_ := getg().m.p.ptr()  runqput(_p_, newg, true) // 寻找p,放到本地队列或全局队列
}

寻找p,放到本地队列或全局队列的逻辑都在runqput方法里面,有兴趣的可以下去分析下。

如何实现协程并发

上面的G-M-P调度模型解决了多线程并发时,会抢夺协程队列的全局锁问题,那协程顺序执行,无法并发的问题又是如何处理的呢。

协程饥饿问题

两个线程正在运行的协程的执行时间特别长,会导致后面对时间敏感的协程无法得到切换执行,造成异常。

![[协程饥饿问题图示.png]]

如何解决呢,回到之前的单线程循环模型,如果在执行超长协程或业务的时候,引入某种轮换机制,超长协程执行一段时间后将其暂停,切换执行一下后面的协程,以防后面有一些时间敏感的协程得不到执行会导致异常。
![[单线程循环调度协程图示.png]]

所以这种超大协程,执行到业务轮换点时,保存现场,将执行中的业务数据和代码执行的行数,保存到自己的协程结构体中,放回队列或休眠,让出线程从队列取一个优先级较高的协程进行执行。
![[解决协程饥饿问题-触发切换.png]]

用下面一个更抽象的图来描述,那就是通过本地队列的小循环来解决本地队列的协程饥饿问题。
![[解决协程饥饿问题-本地队列小循环.png]]

又来了一个新问题,如果本地队列的协程循环了很多次还没有执行完,势必会造成全局队列的协程饥饿。所以在本地小循环的时候,会在适当的时候从全局队列中拿一些上来进行执行,也参与一下本地的小循环,这样就可以解决全局的协程队列得不到运行的问题。
![[解决协程饥饿问题-全局队列循环.png]]

回到之前的schduler方法,我们来看下,全局队列大循环的逻辑在哪里体现的,找到下面这行代码,意思是每执行61次线程循环,会从全局的协程队列中拿一个进我们的本地队列:

func schedule() {if _g_.m.p.ptr().schedtick%61 == 0 && sched.runqsize > 0 {  lock(&sched.lock)  gp = globrunqget(_g_.m.p.ptr(), 1)  unlock(&sched.lock)  }
}

切换的时机

超大协程的业务轮换点是如何判断的呢,会在什么情况下进行一个切换:

  • 主动挂起(runtime.gopark)
  • 系统调用完成时

主动挂起(runtime.gopark)

![[协程切换-主动挂起图示.png]]

业务方法中如果调用了gopark()方法,会直接从线程循环中跳转到线程循环的开头,执行schedule()方法,重新从协程队列取协程进行执行,这样就可以解决后面小的任务饥饿的问题,这个方法在runtime/proc.go中:

// 让我们现在正在运行的这个协程进入等待状态
func gopark(unlockf func(*g, unsafe.Pointer) bool, lock unsafe.Pointer, reason waitReason, traceEv byte, traceskip int) {  ......mcall(park_m)  
}

主要的逻辑就是维护了我们的协程和m的一些状态,最后用mcall调用了park_m这个方法,mcall的调用之前讲过,它会切换到g0栈上执行里面的方法,后面的函数调用关系就用g0栈来记录。接着看下park_m这个方法:

// park continuation on g0.  
func park_m(gp *g) {  ......schedule()  
}

这个方法主要就是进行了一些状态的维护和一些逻辑检查,最重要的是后面调用了schedule这个方法,回到了线程循环的起始点。

关于gopark这个方法还有两点需要注意,那就是这个方法是小写开头的,说明我们自己是调用不了的,调用不了为什么还能叫做主动挂起呢,虽然我们自己调用不了,但是我们在业务中使用的一些逻辑会主动调用gopark,例如涉及到锁、channel、sleep。第二点就是调用了gopark这个方法后,我们的协程会进入waiting状态,是没有办法被再次立即调用的,例如sleep只有当sleep结束后,系统逻辑会自动地将协程的状态改为operable,这样我们的调度器会再次调度这个协程。

系统调用完成时

![[协程切换-系统调用完成时.png]]

我们的业务程序不可避免会做一些系统调用,比如说检查网络状态、硬件状态,这类系统底层命令的调用,一旦有这种系统调用,在完成后,我们的协程会在exitsyscall()方法中进行协程切换。关于exitsyscall这个方法也在runtime/proc.go中:

//go:nosplit  
//go:nowritebarrierrec  
//go:linkname exitsyscall  
func exitsyscall() {......Gosched()......
}

它会在里面进入一个Gosched的方法,会在里面用mcall去调用gosched_m

func Gosched() {  checkTimeouts()  mcall(gosched_m)  
}

gosched_m里面会调用goschedImpl方法:

func gosched_m(gp *g) {  if trace.enabled {  traceGoSched()  }  goschedImpl(gp)  
}

goschedImpl这个方法里面就再次调用了schedule这个方法,回到了线程循环的起始点

func goschedImpl(gp *g) {  ......schedule()  
}

关于系统调用我们不用特别在意,只要知道涉及到系统调用,他会进入到exitsyscall方法,我们的线程就会停止这个协程,返回到线程循环的起始位置,执行别的协程。至于为什么会这样,其实也没有别的什么原因,就是想让它在执行完系统调用后找一个时机切换下,防止它永远不切换。

总结

  • 如果协程顺序执行,会有饥饿问题
  • 协程执行中间,将协程挂起,执行其它协程
  • 完成系统调用时挂起,也可以主动挂起
  • 防止全局队列饥饿,本地队列随机抽取全局队列

抢占式调度

如果有一个超大业务的协程,既不主动挂起也不系统调用,那这种情况下就势必会引发其它协程的饥饿问题,这该怎么办?

基于协作的抢占式调度

思路

有没有一个地方,经常会被调用?能不能在这个地方做一些工作呢,是有的,这个方法叫做runtime.morestack_noctxt

用之前介绍协程的本质的这个例子,用汇编看下,将其编出来后,有没有什么特点。

func do1() {  func2()  
}  func do2() {  func3()  // 在这里打个断点
}  func do3() {  fmt.Print("dododo")  
}  func main() {  go func1()  time.Sleep(time.Minute)  
}

go build -gcflags -S main.go上面的代码,一个个看这些方法编出来后的内容,do1在调用do2之前会调用runtime.morestack_noctxt方法,do2在调用do3之前也会调用runtime.morestack_noctxt方法,只要我们的方法中有调用其它的方法,编译器在编译的时候都会给它插入一个runtime.morestack_noctxt方法,也就是在调用其它方法之前,都要调用一下runtime.morestack_noctxt方法。

![[协程切换-标记抢占.png]]

runtime.morestack_noctxt

runtime.morestack_noctxt的本意是检查协程栈是否有足够空间,如果没有足够的空间会进行扩容操作,这个业务本身与我们的协程调度没有任何关系。既然每次业务在函数调用时,总会被编译器插入这个方法,我们就可以在这个方法里面下个钩子。

标记抢占

这个钩子就是标记抢占,怎么个标记抢占法呢,就是当系统监控到Goroutine运行超过10ms时,会认为这是一个大协程,这个协程会引发其它协程产生饥饿问题,系统会将g结构体里面的stackguard0字段的值置为0xfffffade,这个值有个解释含义叫抢占标志。

抢占

在调用runtime.morestack_noctxt方法时会判断是否被抢占,如果被抢占,就回到schedule方法。

进入go源码,我们看下runtime.morestack_noctxt这个方法,在runtime/stubs.go这个文件中,发现只有声明,没有实现,说明是用汇编实现的:

func morestack_noctxt()

每个平台都实现了对应的morestack_noctxt方法,说明这个方法的逻辑是平台相关的,我们找一个runtime/asm_amd64.s文件下的morestack_noctxt方法来查看:

// morestack but not preserving ctxt.  
TEXT runtime·morestack_noctxt(SB),NOSPLIT,$0  MOVL   $0, DX  JMP    runtime·morestack(SB)

不保留上下文,跳转到了runtime.morestack方法,进入这个方法,发现也只有声明,没有实现,说明是用汇编实现的:

func morestack()

我们找一个runtime/asm_amd64.s文件下的morestack方法来查看:

TEXT runtime·morestack(SB),NOSPLIT,$0-0  // Cannot grow scheduler stack (m->g0).  ......CALL   runtime·newstack(SB)  ......

这里面大量的逻辑是处理栈深度不足的问题,可以先不用管,在最后调用了一个runtime.newstack方法,可以进入这个方法看下,在runtime/stack.go文件中:

//go:nowritebarrierrec  
func newstack() {stackguard0 := atomic.Loaduintptr(&gp.stackguard0)preempt := stackguard0 == stackPreemptif preempt {  // Act like goroutine called runtime.Goschedgopreempt_m(gp) // never return  }
}

这个方法里面会处理很多新生成一个栈的逻辑,与我们的内容没有多大关系。注意这个地方,preempt就是抢占的意思,他会判断一下g结构体stackguard0这个值是否被标记成了抢占这个值,就是0xfffffade,如果发现抢占的标记是true,就会调用gopreempt_m方法,在这个方法里面会调用goschedImpl方法,goschedImpl最终会调用schedule方法,回到线程循环的起始点。

业务方法在执行函数调用时,会在morestack方法中判断该协程是否标记了抢占,如果被标记了抢占,就会回到schedule方法,获取新的协程进行运行,防止协程饥饿问题。
![[协程切换-基于协作的抢占式调度.png]]

那上面这种方法是不是非常完美了呢,非也非也,继续往下看

基于信号的抢占式调度

基于协作抢占的缺陷

上面基于协作的抢占式调度有什么样的问题呢,看下面这段代码:

func do1() {  i := 0  for true {  i++  }  
}  func main() {  go do1()  
}

这段代码,既没有系统调用,也不会主动挂起(没有涉及到锁、channel、sleep等逻辑),更不会被标记抢占,这个协程会永远占据这个线程。不信可以用汇编看下,里面没有插入morestack_noctxt这个方法,因为没有函数调用。如果真的是这样,多开几个这样的协程,那不是后面的其它协程都执行不了,全部都饥饿。有大神想出了一招,那就是基于信号的抢占式调度,先看下什么是信号,这里的信号,指的是线程信号

线程信号

  • 操作系统中,有很多基于信号的底层通信方式
  • 比如Linux系统有SIGPIPE、SIGURG、SIGHUP信号
  • 线程可以注册对应信号的处理函数

实现

  • 注册SIGURG信号的处理函数(这个信号不常用)
  • GC工作时,向目标线程发送信号(GC时,很多线程业务都停了,适合做抢占)
  • 线程收到信号,触发调度

原理图如下,注册的这个信号处理函数就叫doSigPreempt,做信号抢占。当垃圾回收器GC发送SIGURG抢占信号后,陷入到业务方法中的线程会立即跳转到doSigPreempt方法,这个方法其实就是做重新调度循环。
![[协程切换-基于信号的抢占式调度.png]]

看下这个doSigPreempt方法的源码,在runtime/signal_unix.go这个文件中:

// doSigPreempt handles a preemption signal on gp.  
func doSigPreempt(gp *g, ctxt *sigctxt) {ctxt.pushCall(abi.FuncPCABI0(asyncPreempt), newpc)
}

这个方法最核心的就是会调用asyncPreempt这个方法,这个方法是由汇编实现的,在runtime/preempt.go这个文件中:

// asyncPreempt is implemented in assembly.
func asyncPreempt()

asyncPreempt方法会调回来,调到它下面这个asyncPreempt2方法,这个方法里面会通过mcall调用preemptPark方法。

func asyncPreempt2() {   ......mcall(preemptPark) ...... 
}

preemptPark这个方法,最终会调用schedule()这个方法,回到线程循环的起始点。

func preemptPark(gp *g) {schedule()
}

总结

  • 基于系统调用和主动挂起,协程可能无法调度
  • 基于协作的抢占式调度:业务主动调用morestack()
  • 基于信号的抢占式调度:强制线程调用doSigPreempt()

http://www.mrgr.cn/p/22806314

相关文章

【python的魅力】:教你如何用几行代码实现文本语音识别

文章目录 引言一、运行效果二、文本转换为语音2.1 使用pyttsx32.2 使用SAPI实现文本转换语音2.3 使用 SpeechLib实现文本转换语音 三、语音转换为文本3.1 使用 PocketSphinx实现语音转换文本 引言 语音识别技术&#xff0c;也被称为自动语音识别&#xff0c;目标是以电脑自动将…

电脑是组装的好还是原装的好?

组装电脑和原装电脑孰优孰劣一直备受争议。困扰着无数人的问题:组装电脑和原装电脑到底哪个更出色?下面php小编新一将为您详细介绍这两者的优缺点,帮助您做出明智的选择。继续阅读,探索组装电脑的灵活性、升级潜力和性价比,以及原装电脑的稳定性、保修和简便性。电脑是组装…

32.Docker认识

Docker介绍 Docker是一个快速交付应用&#xff0c;运行应用的技术。 1.可以将程序、依赖、运行环境一起打包为一个镜像&#xff0c;可以迁移到任意Linux操作系统。 2.运行时利用沙箱机制行程隔离容器&#xff0c;各个应用互不干扰。 3.启动、移除都可以通过一行命令完成&am…

【深耕 Python】Quantum Computing 量子计算机(1)图像绘制基础

一、绘制静止图像 使用matplotlib库绘制函数图像y sin(pi * x): import math import matplotlib.pyplot as pltx_min -2.0 x_max 2.0N 1000x1 [] y1 []for i in range(N 1):x x_min (x_max - x_min) * i / Ny math.sin(math.pi * x)x1.append(x)y1.append(y)plt.xl…

OpenCV(一) —— OpenCV 基础

1、OpenCV 简介 OpenCV&#xff08;Open Source Computer Vision Library&#xff09;是一个基于 BSD 许可开源发行的跨平台的计算机视觉库。可用于开发实时的图像处理、计算机视觉以及模式识别程序。由英特尔公司发起并参与开发&#xff0c;以 BSD 许可证授权发行&#xff0c…

小程序wx.getlocation接口如何开通?

小程序地理位置接口有什么功能&#xff1f; 随着小程序生态的发展&#xff0c;越来越多的小程序开发者会通过官方提供的自带接口来给用户提供便捷的服务。但是当涉及到地理位置接口时&#xff0c;却经常遇到申请驳回的问题&#xff0c;反复修改也无法通过&#xff0c;给的理由…

python交教程4:文件操作

文件操作流程 人类操作一个word流程: 1、找到文件、双击打开 2. 读或修改 3. 保存&关闭 ⽤python操作⽂件也差不多: 只读模式 创建模式 追加模式 遍历文件 图片视频--二进制文件 其他方法 打开文件--混合模式

Go Web开发【xorm 框架】

1、xorm 1.1、xorm 简介 xorm 是一个简单而强大的Go语言ORM库. 通过它可以使数据库操作非常简便。 特性 支持 struct 和数据库表之间的灵活映射&#xff0c;并支持自动同步事务支持同时支持原始SQL语句和ORM操作的混合执行使用连写来简化调用支持使用ID, In, Where, Limit,…

Gateway结合Nacos使用!!!

一、本地结合使用 1. 引入依赖 <dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId> </dependency> 2. bootstarp.yml配置文件 如果Nacos中配置使用yaml格式&…

内联函数、引用、汇编

内联函数内联函数是一种特殊的 C++ 函数,编译器会将它的代码直接插入到调用它的位置,而不是像普通函数那样进行函数调用。这可以减少函数调用的开销,从而提高性能。#include <iostream> using namespace std;int func(int v1, int v2) {return v1 + v2;}inline int fu…

解析mysql奇葩语句

首先看看完整的表如下图那么看看一个比较奇葩的语句select * from users where name = aa=bb这个语句为啥能执行成功以及为什么打印出了除了两个aa之外的所有行数据呢。我们来解释一下原理。 当我们使用 where 语句的时候, where是会一行一行的匹配的 ,同时where的执行顺序是…

Go-编程实用手册(全)

Go 编程实用手册(全)原文:zh.annas-archive.org/md5/62FC08F1461495F0676A88A03EA0ECBA 译者:飞龙 协议:CC BY-NC-SA 4.0前言 本书将通过解决开发人员常见的问题来帮助您学习 Go 编程语言。您将首先安装 Go 二进制文件,并熟悉开发应用程序所需的工具。然后,您将操作字符…

对2023年图灵奖揭晓看法

2023年图灵奖揭晓&#xff0c;你怎么看&#xff1f; 2023年图灵奖&#xff0c;最近刚刚颁给普林斯顿数学教授 Avi Wigderson&#xff01;作为理论计算机科学领域的领军人物&#xff0c;他对于理解计算中的随机性和伪随机性的作用&#xff0c;作出了开创性贡献。这些贡献不仅推…

Visual studio调试技巧

Visual studio调试技巧 bug是什么&#xff1f;Debug和ReleaseDebugRelease 如何调试VS调试快捷键调试过程中查看程序信息查看临时变量的值查看内存信息查看调用堆栈查看汇编信息查看寄存器信息 编译常见错误编译型错误链接型错误运行时错误 bug是什么&#xff1f; bug的英文释…

改进需求分析书

需求规格说明书 该项目是一个基于TCP用QT开发的五子棋对战系统。 项目仓库地址 1.1面向用户分析 五子棋是一种简单的休闲游戏,主要面向不需要高强度消耗、高耗时的网络用户。 对于本项目,目标人群精确至需要在游戏的同时进行社交的用户,他们需要在保证游戏正常运行的同时,直…

ThreeJS:坐标辅助器与轨道控制器

ThreeJS与右手坐标系 使用ThreeJS创建3D场景时&#xff0c;需要使用一个坐标系来定位和控制对象的位置和方向。 ThreeJS使用的坐标系是右手坐标系&#xff0c;即&#xff1a;X轴向右、Y轴向上、Z轴向前&#xff0c;如下图所示&#xff0c; ThreeJS-右手坐标系 Tips&#xff1a;…

code-server容器webpack的ws无法连接解决方法

TLDR 通过指定client的wsrul去连接ws devServer.client.webSocketURL ‘wss://<Forwarded uri>/ws’ 拓扑 1、code-server: 用于编写代码、启动webpack dev-server 服务&#xff1b;[https://<domain>:8001] 2、webpack: 用于浏览dev-server服务&#xff1b;[ht…

Picks Theorem 学习笔记

求顶点都是整点的简单多边形内部的整点个数。Picks Theorem 学习笔记 UVA10088 题目传送门 题意:顺时针或逆时针地给出一个 \(n\) 个顶点(顶点都是整点)的简单多边形,求这个多边形内部的整点数量(位于多边形形上的整点不算)。 Picks Theorem 对于一个顶点都是整点的简单多…

DC-9-sudo提权

标签:SQL注入、本地文件包含LFI、端口敲门、hydra爆破、linux提权 0x00 环境准备 下载地址:https://www.vulnhub.com/entry/dc-9,412/ 靶机描述: DC-9 is another purposely built vulnerable lab with the intent of gaining experience in the world of penetration testi…