Go bootstrap
本文基于Go 1.13。
本人首次接触golang,也不是gopher,主要想研究一下go的用户态调度框架。因为看到m0,g0和schedinit,所以顺带着也把bootstrap过程看了一下。既然看了,就记一点笔记吧。另外本文紧扣与调度相关的主题,一些go的其他特性,虽然非常棒但是不在本文讨论范围。包括但不限于:
- garbage collection
- C Go
- Linux signal处理
- Trace操作
- 栈操作
golang和其他语言一样,用户代码的入口是用户定义的main函数。那么go程序从启动到main函数运行之间的过程就是所谓的bootstrap过程。网上也有大把的资料介绍这一流程。本文以阅读Go源码为主,所以暂且不列参考文献了。
Go程序的入口定义在rt0_<os>_<arch>.s
,例如rt0_linux_arm.s
。入口函数是:_rt0_arm_linux
。Go的汇编语法不同于常见的语法格式,具体可以参考Go官方网页:A Quick Guide to Go's Assembler。本文不做过多牵涉具体语法的解释。
_rt0_arm_linux
通过以下调用,进入runtime库的rt0_go函数。_rt0_arm_linux
--> _rt0_arm_linux1
--> runtime·rt0_go
rt0_go
该函数做了以下这些事情:
- 绑定m0, g0
// set up g register
// g is R10
MOVW $runtime·g0(SB), g
MOVW $runtime·m0(SB), R8
// save m->g0 = g0
MOVW g, m_g0(R8)
// save g->m = m0
MOVW R8, g_m(g)
- 设置g0的stackguard0和stackguard1
- runtime.emptyfunc
- runtime._initcgo
- runtime.check
- runtime.args
- runtime.checkgoarm
- runtime.osinit
- runtime.shcedinit
10.runtime.newproc创建G来运行runtime.main
11.runtime.mstart来运行M0,M0获得第一个G(注意不是g0),来运行runtime.main
以上这一堆,最终让runtime.main运行起来,runtime.main会调用用户的main函数,即main_main或者叫main.main。
另外大多数的代码都是为了做一些检查,以及操作系统级别的初始化。特别值得关注的是runtime.schedinit, runtime.newproc以及runtime.mstart。
创建G的newproc和运行M的mstart都是通用函数,不光是在bootstrap过程中使用。在调度器运行时创建G和运行M都是使用这两个函数。
rto_go是bootstrap的总纲。它调用各个函数,最终进入用户的main函数运行。
schedinit
schedinit对调度器做了基本的初始化,摘出两个可能与调度相关的函数:
- mcommoninit
- procresize
前者其实也没做啥事儿,调用了mpreinit分配了与signal相关的栈参数gsignal,与调度实没多大关系,暂时略过。后者就比较重要了。
procresize
本函数其实是对整个app里的P做了初始化。先看调用:
procs := ncpu // ncpu在osinit中赋值,ncpu = getncpu()
if n, ok := atoi32(gogetenv("GOMAXPROCS")); ok && n > 0 {
procs = n
}
if procresize(procs) != nil {
throw("unknown runnable goroutine during bootstrap")
}
这里根据环境变量GOMAXPROCS
对ncpu进行了更新。procs逻辑上就对应了P的个数。

- type p,m,g都定义在runtime/runtime2.go中,allp数组也定义在该文件中
- len表示当前slice的长度,cap表示该slice所在数组能容纳的最多的成员数
- pp->init(id)也是定义在proc.go中,对P做初始化
- P与M在这里完成了绑定,为之后mstart做好了准备
runtime.newproc
这里瞄准的是bootstrap阶段的newproc。
newproc的调用如下:
// create a new goroutine to start program
MOVW $runtime·mainPC(SB), R0
MOVW.W R0, -4(R13)
MOVW $8, R0
MOVW.W R0, -4(R13)
MOVW $0, R0
MOVW.W R0, -4(R13) // push $0 as guard
BL runtime·newproc(SB)
mainPC是指向runtime.main函数的指针。所以newproc是为这个函数创建G,并挂在到一个P上运行。
newproc是newproc1的wrapper,为newproc1准备了callergp和callerpc。newproc1在systemstack上运行。
systemstack
systemstack的语意是在系统栈上运行函数fn。
- 如果当前栈指针是在g0栈或者gsignal栈上,则直接调用fn函数然后返回。
- 否则,systemstack将切换到g0栈上调用 fn然后切换回来。
// func systemstack(fn func())
TEXT runtime·systemstack(SB),NOSPLIT,$0-4
MOVW fn+0(FP), R0 // R0 = fn
MOVW g_m(g), R1 // R1 = m
MOVW m_gsignal(R1), R2 // R2 = gsignal
CMP g, R2
B.EQ noswitch
MOVW m_g0(R1), R2 // R2 = g0
CMP g, R2
B.EQ noswitch
MOVW m_curg(R1), R3
CMP g, R3
B.EQ switch
这一段就是在判断当前g栈指针的位置,只在最后一种情况下才switch。switch即将栈指针切换到g0栈。
此处g, g_m, m_curg,都是变量的表示方法,下划线表示'.'。即:
- g表示当前g,bootstrap阶段就是g0
- g_m表示g.m
- m_curg表示m.curg
上面这段snip中,g实际上就是g的栈指针,因为栈指针是g的第一个参数,可以参考runtime2.go中type g的定义。参看:
type g struct {
// Stack parameters.
// stack describes the actual stack memory: [stack.lo, stack.hi).
// stackguard0 is the stack pointer compared in the Go stack growth prologue.
// It is stack.lo+StackGuard normally, but can be StackPreempt to trigger a preemption.
// stackguard1 is the stack pointer compared in the C stack growth prologue.
// It is stack.lo+StackGuard on g0 and gsignal stacks.
// It is ~0 on other goroutine stacks, to trigger a call to morestackc (and crash).
stack stack // offset known to runtime/cgo
stackguard0 uintptr // offset known to liblink
stackguard1 uintptr // offset known to liblink
...
}
newproc1

以上的流程还是比较清楚的。在有free G的时候获取之,否则malg创建一个G。G在创建出来的时候,状态为_Gdead,初始化以后是_Grunnable。
aquirem和releasem的意义没看明白。按照注释的意思是,阻止抢占。
aquirem: disable preemption because it can be holding p in a local var
有点引用计数的感觉。
runtime.mstart
mstart负责运行M,在bootstrap阶段这里start的实际上是M0。
与newproc类似,mstart是mstart1的封装。mstart为运行mstart1做一些准备,主要是m.g0栈区数据的初始化。当进入mstart1运行后,函数再也不会返回,因为这里面会调用调度器的schedule函数。如果函数返回到这里,说明再也没有东西需要运行,也就是程序到达main函数结尾,程序要退出。这也是mexit的语意。在Linux的实现就是调用SYS_exit系统调用来退出程序。
mstart --> mexit --> exitThread
Linux平台的exitThread定义在runtime/sys_linux_arm.s中,是一个汇编函数。
// func exitThread(wait *uint32)
TEXT runtime·exitThread(SB),NOSPLIT|NOFRAME,$0-4
MOVW wait+0(FP), R0
// We're done using the stack.
// Alas, there's no reliable way to make this write atomic
// without potentially using the stack. So it goes.
MOVW $0, R1
MOVW R1, (R0)
MOVW $0, R0 // exit code
MOVW $SYS_exit, R7
SWI $0
可见最终调用的SYS_exit,并且设置了返回值。
mstart1

bootstrap阶段是左边的分支,也就是说会执行mstartm0,之后进入调度
- asminit:调用runtime.goarm来初始化汇编的运行环境,不关系主逻辑,没有关注
- minit:Linux平台,该函数是对信号处理的一些初始化
mstartm0
在Linux平台上,这个函数会对signal处理做一些初始化,和调度本身没啥关系,所以不予关注。
fn
对于M0,其线程函数是什么?fn即runtime.main。参看runtime.rt0_go
// create a new goroutine to start program
MOVW $runtime·mainPC(SB), R0
runtime.main

这里并没有涉及调度的代码,只是调用了用户定义的main函数。
main函数调用采用间接调用。猜测因为编译runtime的时候还不知道main.main的地址,只能放一个符号在这里,链接的时候再做替换。
fn := main_main // make an indirect call, as the linker doesn't know the address of the main package when laying down the runtime
fn()
用户main函数退出时,调用exit退出整个程序。
总结
整个bootstrap过程始于rt0_go,终止于runtime.main。至此,用户main函数得到调用,Go的用户态调度器也开始运行了