源码协程切换底层原理？

访客源码剖析 2026-06-08 11:03:35 1

协程切换的底层原理与实现机制

目录导读

协程切换的本质：程序执行流的主动让出
用户态与内核态：协程切换为何比线程快？
核心数据结构：栈、上下文与调度器
汇编级实现：寄存器保存与恢复的魔法
主流语言实现对比：Go、Lua、C++20
常见问题与问答

协程切换的本质：程序执行流的主动让出

协程（Coroutine）切换并非操作系统层面的调度，而是程序在用户态主动让出执行权，与线程切换不同，协程切换不涉及内核中断、不经过系统调用，本质上是函数调用栈的切换。

在源码层面,一次协程切换通常包含以下步骤：

保存当前协程的执行上下文（CPU寄存器、栈指针、程序计数器）
恢复目标协程的上下文
跳转到目标协程上次暂停的位置继续执行

这种“主动让出”模式使得协程切换的开销通常在纳秒级，而线程切换由于需要陷入内核,开销在微秒级。

用户态与内核态：协程切换为何比线程快？

线程切换需要：

陷入内核（系统调用开销）
保存/恢复所有寄存器
切换内存页表（TLB刷新）
调度器重新选举（可能涉及锁）

协程切换：

全在用户态完成（无系统调用）
只保存必要的寄存器（通常约12-16个）
不涉及页表切换（同一进程内）
调度逻辑是简单的轮询或回调

关键差异：协程切换是可控的协作式，线程切换是抢占式，协作式意味着开发者需要手动管理“让出点”,但换来的是极致性能。

核心数据结构：栈、上下文与调度器

1 协程栈（Stack）

每个协程拥有独立的栈空间（通常2KB-4KB），栈帧中保存了局部变量、函数调用链、返回地址，切换时,须完整保存栈内容或将栈指针指向目标栈。

2 上下文（Context）

协程上下文是CPU寄存器的快照,至少包含：

指令指针（IP/EIP/RIP）：下一条要执行的指令地址
栈指针（SP/ESP/RSP）：当前栈顶位置
帧指针（BP/EBP/RBP）：函数调用栈基址
通用寄存器：rax、rbx、rcx、rdx等（x86-64架构）

3 调度器（Scheduler）

典型的协程调度器采用就绪队列+等待队列结构,通过循环从就绪队列取出协程进行切换。

// 伪代码示意
struct coroutine {
    void* stack_pointer;
    void* instruction_pointer;
    char* stack_memory;
    int status;  // READY/RUNNING/SUSPENDED
};
struct scheduler {
    queue ready_queue;
    coroutine* current;
};

汇编级实现：寄存器保存与恢复的魔法

协程切换的核心代码通常用汇编编写，以下以x86-64为例解析：

1 保存当前上下文

switch_coroutine:
    // 保存被调用者保存的寄存器
    push rbx
    push rbp
    push r12
    push r13
    push r14
    push r15
    // 保存栈指针到当前协程的上下文
    mov [rdi], rsp      ; rdi指向当前协程的存储区
    mov [rdi+8], rbp    ; 保存基址指针
    // 切换栈
    mov rsp, [rsi]      ; rsi指向目标协程的存储区
    mov rbp, [rsi+8]
    // 恢复目标协程的寄存器
    pop r15
    pop r14
    pop r13
    pop r12
    pop rbp
    pop rbx
    ret  ; 跳转到目标协程的下一条指令

2 关键点解析

[rdi]和[rsi]分别指向当前协程和目标协程的上下文结构体
栈指针（rsp）的切换相当于“偷梁换柱”，使CPU立即使用新栈
ret指令会弹出目标栈上的返回地址，从而跳转到正确位置

这种汇编实现保证了切换的原子性（单条指令级）,避免了锁竞争。

主流语言实现对比：Go、Lua、C++20

1 Go语言（goroutine）

采用M:N调度模型：M个goroutine运行在N个OS线程上
协程栈初始仅2KB，可动态增长（通过分段栈或复制栈）
切换点由编译器注入（在函数调用的prologue处检查是否需要切换）

2 Lua（lua_State）

使用对称协程：每个协程有独立栈和callinfo链
切换通过lua_yield和lua_resume实现以TValue结构保存在Lua堆中，支持跨平台

3 C++20（无栈协程）

编译器生成状态机，将协体体分解为多个暂停点
切换时仅恢复promise对象中的状态变量，不涉及栈切换
性能更高（无需保存完整栈），但功能受限

常见问题与问答

Q1：协程切换时，全局变量会被切换吗？ A：不会，全局变量和堆内存属于进程共享空间，协程切换仅切换栈和寄存器，全局变量对所有协程可见,这也是协程比线程更轻量的原因之一。

Q2：协程切换会导致栈溢出吗？ A：可能，每个协程有固定栈大小（通常2-4KB），如果深层递归或创建大量局部变量，会触发栈溢出，现代实现如Go使用动态栈规避此问题。

Q3：协程切换需要锁吗？ A：通常不需要，协作式调度下，协程在显式让出前不会被打断，因此操作就绪队列时无需加锁，但若支持抢占式（如Go的g0调度）,则可能涉及原子操作。

Q4：用户态协程能否利用多核？ A：能，但需要将多个协程绑定到多个OS线程（线程池），并通过线程间通信调度,Go的调度器会自动将goroutine分布到多个CPU核心。

Q5：协程与纤程（Fiber）有何区别？ A：本质相同，纤程是Windows术语，协程是Unix/Linux社区常用术语，区别在于：纤程通常指系统级用户态线程，而协程更强调语言层面的语法支持（如async/await）。

协程切换的底层原理本质上是一场受控的上下文切换——通过保存/恢复关键寄存器和栈指针，在用户态实现轻量级执行流跳转，其性能优势源于避免了内核陷、页表切换和锁开销，理解汇编级实现和调度器设计，是掌握协程编程模型的关键一步，对于性能敏感场景,协程是替代线程的理想选择。

标签：底层原理

本文地址： https://www.dfhcn.com/post/2127.html

文章来源：访客