PCIe 关键技术—— elastic buffer
转载:[连载]PCIE 关键技术(一)elastic buffer
前言:
在高速数据传输协议中,PCI Express (PCIe)作为一种广泛使用的接口标准,其高效的数据传输能力依赖于复杂的时钟管理和缓冲技术,其中,弹性缓冲区(elastic buffer)是PCIe系统中不可或缺的一部分,它在解决时钟域差异和数据传输同步问题上发挥着关键的作用。
什么是弹性缓冲区?
弹性缓冲区是一种用于处理不同时钟域之间频率和相位差异的先进先出(FIFO)缓冲器,它位于接收端(RX)的本地时钟域与恢复时钟域之间,通过插入/删除特定的符号(如SKP,skip order set)来调整数据流的传输频率,从而实现时钟同步。
弹性缓冲区的工作原理:
弹性缓冲区的核心功能是通过动态调整缓冲区的数据量来补偿时钟频率和相位的差异,具体来说,当本地时钟域的频率低于恢复时钟域时,弹性缓冲区会检测到数据进入速度过快,并从缓冲区中删除一些SKP符号以减缓数据流,反之,当本地时钟的频率高于恢复时钟的时候,缓冲区会插入SKP符号以增加数据流的速度。
弹性缓冲区的设计电路
如图所示,弹性缓冲器包含7个单元,并且具有两个时钟域:(a)本地时钟域(buffer的输出时钟)用于为其所有内部门电路提供时钟信号并传输数据;(b)恢复时钟域(buffer的输入时钟)用于锁存输入数据。
- input detect unit :检测输入数据是否为SKP,并根据测试结果提供SKP删除操作的指令
- write pointer control unit :写指针的二进制和格雷码由写指针控制单元生成,写指针的二进制码用于选择数据写入的存储地址,并在与读指针同步后生成SKP删除操作的指令,同样,写指针的格雷码同步到本地时钟域并与读指针的格雷码进行比较,然后单元生成空标志。
- read pointer control unit:读指针控制的作用是生成读指针的二进制码和gray code,读指针的二进制码是数据读取的存储单元的地址,并在与同步的写指针比较后生成SKP添加的请求标志,读指针的gray code同步到恢复时钟域并与写指针的gray code进行比较,然后生成满标志。
- out detect & control unit:输出检测和控制单元,确定从存储单元读取的数据是SKP字符还是END字符,然后生成相应的符号,此外,它还根据检测结果输出数据。
- synchronous unit:同步单元的功能是将写指针和读指针的gray code同步到本地时钟域和恢复时钟域。
- threshold monitor:阈值监控单元计算FIFO中的有效数据,并决定是否产生SKP添加或删除请求。
弹性缓冲区的深度计算:
弹性缓冲区的深度cover最worse case,由maxpayload size和读写时钟最大偏差决定。SRNS最大的时钟偏差是600ppm,即1666个cycle有一个时钟周期漂移,SRIS最大的时钟偏差是5600ppm,即178个cycle有一个时钟周期漂移。
【
- ppm = 600 → 每 1,000,000 个周期漂移 600 个周期
- 设 N 为漂移 1 个周期所需的周期数
- 比例关系: 600/1,000,000=1/N
- 解得: N=1,000,000/600 ≈ 1666.67
】
需要考虑发送SKP的最大间隔1180-1538 symbol time【协议定死的】和lane的数量Link_width,因此worst-case 的周期漂移个数计算如下:
【
最小值(1180 Symbol Times)
- 目的:防止弹性缓冲溢出或下溢。
- 解释:在两个时钟偏差最大的 SRNS 系统中,如果发送端太久不发送 SKP,接收端的弹性缓冲因为时钟频率不一致,累积的误差就会超过缓冲深度,导致数据丢失或读取错误。协议计算得出,在最坏频偏下,最多只能容忍约 1180 个 Symbol 的时间不发送 SKP。因此,发送端必须至少每 1180 个 Symbol 发送一次 SKP(或者说,不能比这个间隔更久)。
最大值(1538 Symbol Times)
- 目的:限制 SKP 的频率,保证带宽效率,并给接收端留出处理时间。
- 解释:SKP 是开销,发得太频繁会浪费带宽。同时,接收端的弹性缓冲逻辑需要一个稳定的节奏来调整。协议规定发送端最多可以间隔 1538 个 Symbol 发送一次 SKP。
】
max_payload_size=4K overhead = 28byte
对于SRNS ,max_symbol shifted = 4
对于SRIS,max_symbols shifted = 40
Snps 的32G phy elastic buffer 深度为88
大多数弹性缓冲区采用“半满方法” (half-full method)进行设计,这种方法通过保持缓冲器在半满状态来优化数据传输效率。
