当前位置：首页 > news >正文

CGRA空间-时间解耦映射技术解析与优化

news 2026/6/29 3:51:37

1. 粗粒度可重构阵列(CGRA)映射技术概述

在计算密集型应用领域，粗粒度可重构阵列(CGRA)因其独特的架构特性正获得越来越多的关注。与ASIC和FPGA相比，CGRA在灵活性和能效之间取得了更好的平衡。CGRA由大量处理单元(PE)组成，这些PE通常以二维网格拓扑结构互连，每个PE包含算术逻辑单元(ALU)和寄存器文件。这种架构特别适合流式数据处理和多媒体应用场景，能够在保持较高能效的同时，通过运行时重构适应不同的计算任务。

关键优势：CGRA的指令级重构能力使其能够在不改变硬件结构的情况下，通过配置不同的指令流来执行多样化的计算任务，这为边缘计算等资源受限场景提供了理想的硬件加速方案。

2. 传统CGRA映射方法的局限性

2.1 空间-时间耦合的映射挑战

传统CGRA编译技术面临的核心难题是如何将数据流图(DFG)高效映射到PE阵列上。这一过程涉及两个关键维度：

时间维度：确定每个DFG节点的执行时间步，需满足数据依赖关系
空间维度：将DFG节点分配到具体的PE上，并确保数据能通过PE间的互连网络正确传输

现有方法通常采用空间-时间耦合的搜索策略，同时考虑调度、放置和路由三个任务。这种耦合方式导致搜索空间呈指数级增长，特别是在处理大规模CGRA(如20×20阵列)时，编译时间变得难以接受。

2.2 现有技术瓶颈分析

当前主流映射技术可分为启发式方法和精确方法两类：

启发式方法(如EPImap、REGIMap等)：通过图同态或最大团问题来寻找映射方案，但无法保证给定时间解的空间可行性
精确方法(如SAT-MapIt)：采用SAT或ILP公式化映射问题，能提供最优解但计算复杂度高

这些方法普遍存在一个根本性问题：它们无法确保找到的时间调度方案在空间维度上一定有可行的PE分配方案。这种不确定性导致大量计算资源被浪费在探索最终不可行的时间解上。

3. 空间-时间解耦的映射方法论

3.1 基本思想与架构

我们提出的创新方法核心在于将空间和时间维度解耦，分两个阶段独立解决映射问题：

时间阶段：采用改进的SMT(可满足性模理论)公式，专注于寻找满足所有数据依赖约束的时间调度方案
空间阶段：基于单态(monomorphism)图算法，将已确定时间步的DFG映射到CGRA的MRRG(模路由资源图)上

这种解耦策略的关键优势在于，时间阶段的搜索可以专注于时序可行性，而空间阶段的搜索则可以利用时间阶段获得的信息大幅缩小搜索空间。

3.2 关键技术组件

3.2.1 模调度(Modulo Scheduling)

模调度是一种循环流水线优化技术，它将循环执行分为三个阶段：

前奏(Prologue)：初始化流水线
内核(Kernel)：稳定执行阶段，多个循环迭代在此重叠执行
尾声(Epilogue)：完成最后的数据处理

内核阶段的长度称为迭代间隔(II)，是衡量映射质量的关键指标。我们的方法通过SMT求解器寻找最小化II的可行调度方案。

3.2.2 MRRG建模

模路由资源图(MRRG)是表示CGRA架构随时间演变的图模型。对于II=N的调度方案，MRRG包含N个时间步的CGRA副本，通过时间边连接相邻时间步的PE。这种建模方式将空间映射问题转化为DFG到MRRG的图嵌入问题。

4. 时间维度解决方案

4.1 SMT公式化

我们的时间解搜索基于改进的SAT-MapIt框架，但增加了确保空间可行性的关键约束：

模调度约束：编码数据依赖和循环携带依赖的时间关系
- 对于普通数据依赖：若源节点和目标节点在不同迭代，需满足t_d ≤ t_s
- 对于循环携带依赖：若源节点和目标节点在同一迭代，需满足t_d > t_s
容量约束：确保每个时间步调度的操作不超过PE数量
```
∀i ∈ L : C_i ≤ |V_{M_i}|
```
其中C_i是时间步i调度的DFG节点数，|V_{M_i}|是CGRA在时间步i的PE数
连通性约束：限制每个DFG节点在每个时间步的邻居数不超过CGRA的连通度
```
∀v ∈ V_G, ∀i ∈ L : |S_v^i| ≤ D_M
```
S_v^i是DFG节点v在时间步i的邻居集，D_M是CGRA的连通度