当前位置：首页 > news >正文

Lib2Vec：自监督学习在集成电路库单元向量表示中的应用

news 2026/7/23 7:52:47

1. Lib2Vec：自监督学习框架下的库单元向量表示

在集成电路设计领域，库单元（library cell）作为电路网表的基本构建块，其表示方法直接影响着机器学习模型在电路分析和优化任务中的表现。传统方法要么依赖手工定义的特征（需要大量领域专业知识），要么采用独热编码（需要海量训练数据），都存在明显局限性。来自NVIDIA的研究团队提出的Lib2Vec框架，通过创新的自监督学习方式，为这一领域带来了突破性解决方案。

Lib2Vec的核心创新在于将库单元映射到连续的向量空间，使其能够：

自动捕捉单元间的功能和电气相似性
支持向量空间中的语义关系推理（如"BUF向量-INV向量≈NAND3向量-AND3向量"）
适配不同引脚配置的单元类型
生成特定属性（如延迟、功耗）的专用表示

这种表示方式不仅解决了传统方法的痛点，更为开发电路领域的基础模型（foundation models）铺平了道路。

1.1 库单元表示的核心挑战

在深入解析Lib2Vec之前，我们需要理解库单元表示面临的三大核心挑战：

语义定义与评估难题
库单元的语义既包含功能属性（逻辑行为），又包含电气属性（时序、功耗等）。如何准确定义这些语义，并设计有效的评估方法，是首要挑战。例如，两个逻辑功能相同但驱动强度不同的反相器，它们的电气特性差异如何量化？

训练数据生成效率
传统监督学习需要大量标注数据，但在电路设计领域，获取高质量标注成本极高。如何从现有的Liberty文件（描述库单元特性的标准格式）中自动提取训练信号，是提高方法实用性的关键。

模型架构灵活性
实际电路库中包含数百种单元类型，引脚数量从几个到几十个不等。设计能够适应这种多样性，同时支持属性专用表示的模型架构，对框架的实用性至关重要。

提示：Liberty文件是描述库单元特性的行业标准格式，包含功能定义、时序模型、功耗模型等信息。ASAP7是学术界广泛使用的7nm工艺节点预测性PDK（工艺设计套件）。

2. Lib2Vec框架设计解析

Lib2Vec的整体架构包含三个创新组件，共同解决了上述挑战：

2.1 自动化规律性测试生成

为了评估表示质量，Lib2Vec设计了三类自动化测试：

功能反转测试
评估单元对之间的逻辑互补关系。例如：

(BUF vs INV) = (AND2 vs ?) → 答案应为NAND2
(OR5 vs NOR5) = (OA333 vs ?) → 答案应为OAI333

测试方法：通过向量运算验证关系是否成立（如验证vector(INV)-vector(BUF)+vector(AND2)是否接近vector(NAND2)）

功能相似性测试
比较单元在相同输入下的真值表匹配程度。例如：

FunSim(NAND2,NOR2)=2/4（4种输入组合中有2种输出相同）
FunSim(XOR2,NOR2)=1/4

测试分为"简单"（相似度差异≥0.5）和"困难"（差异<0.5）两类，评估模型捕捉细微功能差异的能力。

电气相似性测试
以上升延迟为例，测试生成包含四个步骤：

输入条件采样：在输入转换时间和输出负载的取值范围内对数均匀采样22,500个点
输出值计算：对所有单元弧应用相同输入条件，计算延迟值并进行对数转换
相似度度量：使用转换后延迟向量的欧氏距离
测试创建：如"哪个NOR2弧的上升延迟最接近INVx1的Y→A弧？"

2.2 自监督学习方案

Lib2Vec从Liberty文件自动生成四类自监督任务：

功能输出预测
给定单元和输入逻辑值，预测输出值。例如：AND2在A=1,B=0时Y=?
功能差异预测
比较两个单元在相同输入下的输出差异。例如：AND2和XOR2在A=1,B=0时Y的差值?
电气输出预测
预测特定弧在给定条件下的电气参数（延迟、功耗等）。例如：AND2x1的Y→A弧的上升延迟曲线
电气差异预测
比较两个弧在相同条件下的电气参数差异。例如：AND2x1与XOR2x2的Y→A弧延迟差

这种设计确保模型既能学习绝对特性，又能捕捉相对差异，这对实际电路优化任务至关重要。

2.3 基于注意力的模型架构

Lib2Vec采用双模型设计（功能模型和电气模型），共享相似的注意力机制架构：

核心组件：

可学习的单元嵌入
引脚名称嵌入（跨单元共享）
属性令牌嵌入（如"上升延迟"）
单头注意力层（限制参数量，迫使知识编码到嵌入中）

功能预测流程：

注意力层结合单元嵌入和引脚嵌入，生成输出引脚的功能嵌入
全连接层将功能嵌入转换为逻辑值预测

电气预测流程：

拼接基础电气嵌入和属性令牌，生成属性专用表示
注意力层结合属性表示和引脚嵌入，生成时序弧嵌入
全连接层映射为电气参数预测

这种设计实现了三个关键能力：

处理变长引脚配置
生成属性专用表示
保持模型轻量化

3. 实现细节与实验结果

3.1 实验设置

研究团队基于ASAP7库（190个标准单元，86种功能类型）进行实验：

硬件配置：AMD EPYC 7742 CPU + NVIDIA A100 GPU
训练时间：
- 数据生成：~10分钟
- 功能表示学习：~20分钟
- 电气表示学习：~4小时
嵌入维度：对比了32/64/128等不同尺寸

3.2 规律性测试结果

功能反转测试（930个测试用例）：

嵌入尺寸64时top-10准确率61%（随机猜测11%）
显示模型成功捕捉了逻辑互补关系

功能相似性测试：

简单测试（116个）：接近100%准确率
困难测试（166个）：>80%准确率（基线50%）

电气相似性测试（各类型数百个测试）：

平均top-1准确率52%（随机7%）
top-3准确率89%（随机22%）
证明模型有效捕捉了时序、功耗等电气特性

3.3 表示可视化分析

通过t-SNE降维可视化，Lib2Vec学习的表示展现出清晰的语义结构：

功能空间自然分为非反相（BUF/AND/OR）和反相（INV/NAND/NOR）两大区域
向量运算揭示规律性关系，如：
- vector(BUF)-vector(INV) ≈ vector(NAND3)-vector(AND3)
- 这种线性关系与NLP中的"king-queen"类比相似
电气空间正确反映了驱动强度排序（如INVx1 < INVx2 < INVx4）

3.4 下游任务验证

在三个网表逻辑预测任务中测试Lib2Vec的迁移效果：

任务设置：
- 生成1,351个人工网表（16-235个单元，7-111个拓扑层级）
- 预测：输出逻辑值、逻辑概率、开关活动性
- 训练数据比例从0.3%（4样本）到10%（135样本）
集成方法：
- 表示集成：直接使用预训练嵌入
- 模型集成：复用Lib2Vec架构和参数
结果：
- 在4样本情况下：
  - 模型集成达到80%准确率（随机初始化65%）
  - RMSE 0.236（随机初始化0.378）
- 证明Lib2Vec显著提升小样本学习能力