当前位置：首页 > news >正文

复位序列的底层逻辑：为什么顺序错了，你的SoC连第一条指令都跑不起来？

news 2026/4/15 14:54:55

该文章同步至OneChan

做过SoC Bringup和原型验证的人都懂：世界上最绝望的bug，不是代码编译不过，不是功能跑不通，而是流片回来的第一颗芯片，上电就死，JTAG连不上，所有电源时钟波形完美，你连调试的入口都没有。

这个故事发生在我同事前公司，他们团队花了一年时间设计的一颗车规RISC-V芯片，FPGA原型验证跑了整整六个月，所有测试用例全过，覆盖率100%。流片回来第一次上电，50%的芯片直接挂死，没有任何征兆。

他们换了三版封装，测了所有工艺角，扫了每一根电源和时钟线，甚至把芯片磨开用电子显微镜看，都没发现任何问题

最后，是他们团队里一个做了十五年数字设计的老工程师，在复位控制器的RTL代码里找到了问题：只是两个寄存器的复位释放顺序写反了，时间差刚好是一个时钟周期——1ns。

很多做上层嵌入式开发的人永远不会理解：复位不就是拉个高低电平吗？为什么差1ns就能让一颗价值几百万的芯片直接报废？

因为你看到的复位，是软件层面的一个函数调用；而我们看到的复位，是几十亿个晶体管从混沌到有序的过程。这个过程差一个皮秒，结果就是天壤之别。

assign cpu_rst_n = sys_rst_n & pll_locked; assign pc_rst_n = sys_rst_n & pll_locked;

看起来没有任何问题，对吧？CPU和PC寄存器的复位，都是系统复位和PLL锁定信号的与。

但是，在实际的电路中，这两个信号的路径长度是不一样的。CPU复位信号要经过一个缓冲器，才能到达CPU内核；而PC复位信号直接连到了PC寄存器。

所以，PC复位信号会比CPU复位信号早1ns释放。

于是就出现了这样一个时间窗口：

PC寄存器先释放复位，变成0x00000000
指令存储器开始输出0x00000000地址的指令
1ns后，CPU复位释放，开始取指
CPU取到的指令，是指令存储器还没稳定时输出的随机值

就是这1ns的时间差，让他们的芯片50%的概率上电失败。

解决方案简单到可笑：把PC复位信号也经过一个同样的缓冲器，保证两个复位信号同时释放。

改了一行RTL代码，重新流片，花了800万，延期了三个月。

四、固件/原型工程师专属复位序列，经过流片验证

说了这么多，给大家一个经过十多颗芯片流片验证的复位序列。这个序列从RTL设计到固件实现，全程严格遵循，没有出过一次复位问题。

1. RTL设计阶段复位顺序规范

复位拉低顺序（上电时）： 1. 所有主设备（CPU、DMA、GPU、NPU） 2. 总线矩阵和互联 3. 所有从设备（DDR、Flash、UART、SPI等） 4. 时钟系统（PLL、晶振） 5. 电源域 复位释放顺序（上电后）： 1. 电源域 2. 时钟系统（等待晶振起振、PLL锁定） 3. 所有从设备 4. 总线矩阵和互联 5. 所有主设备

铁律：复位释放的顺序，必须和复位拉低的顺序完全相反。

2. 固件Bringup阶段复位序列模板（纯汇编）

.section .reset, "ax" .global _start _start: # 1. 立即关闭所有中断，防止任何干扰 csrw mie, zero csrw mstatus, zero # 2. 复位所有主设备，停止所有总线访问 li t0, RESET_MASTERS_BASE sw zero, 0(t0) # 3. 复位总线矩阵 li t0, RESET_BUS_BASE sw zero, 0(t0) # 4. 复位所有从设备 li t0, RESET_SLAVES_BASE sw zero, 0(t0) # 5. 复位时钟系统 li t0, RESET_CLOCK_BASE sw zero, 0(t0) # 6. 等待所有复位完成，至少100us li t0, 100000 1: addi t0, t0, -1 bne t0, zero, 1b # 7. 初始化时钟系统，等待PLL锁定 call clock_init # 8. 释放从设备复位 li t0, RESET_SLAVES_BASE li t1, 0xffffffff sw t1, 0(t0) # 9. 释放总线矩阵复位 li t0, RESET_BUS_BASE sw t1, 0(t0) # 10. 初始化DDR和Flash call ddr_init call flash_init # 11. 释放主设备复位 li t0, RESET_MASTERS_BASE sw t1, 0(t0) # 12. 重定位中断向量表 la t0, vector_table csrw mtvec, t0 # 13. 跳转到C语言入口 call main # 永远不会执行到这里 j .