当前位置：首页 > news >正文

从NASNet到MnasNet：聊聊神经结构搜索（NAS）这几年是怎么‘卷’起来的

news 2026/8/2 1:43:13

神经结构搜索的进化史：从实验室概念到移动端落地的技术革命

2016年，当Quoc Le团队在Google Brain实验室首次尝试用强化学习自动生成神经网络结构时，他们可能没想到这个看似小众的研究方向会在三年后彻底改变移动端AI模型的开发范式。如今，从手机相册的智能分类到实时AR滤镜，背后都流淌着NAS技术的基因。这场始于学术好奇心的探索，如何一步步突破算力桎梏、跨越理论到应用的鸿沟？让我们拨开技术迷雾，还原这段充满戏剧性的进化历程。

1. 技术黎明期：强化学习与进化算法的双雄争霸

2017年ICLR会议上，Zoph等人发表的《Neural Architecture Search with Reinforcement Learning》像一颗投入平静湖面的石子。他们用800块GPU训练了28天，最终得到的卷积结构在CIFAR-10上达到了当时顶尖的3.65%错误率。这个数字本身并不惊人，但论文揭示了一个颠覆性事实：机器设计的网络可以超越人类专家。

几乎同期，Real等人采用进化算法在相同数据集上取得了3.63%的错误率。两种截然不同的技术路线意外地殊途同归：

方法	核心机制	优势	缺陷
强化学习	RNN控制器生成架构描述字符串	可学习复杂连接模式	需要设计精巧的reward shaping
进化算法	种群突变与精英保留策略	并行搜索效率高	早期易陷入局部最优

早期研究者们很快发现：搜索空间设计比算法选择更重要。Zoph的第二项突破——允许跨层连接的有向无环图搜索空间，将模型错误率进一步降低到3.1%，这直接确立了NAS作为独立研究领域的地位。

2. 效率革命：从计算奢侈到平民化应用

当业界还在为NASNet的千块GPU需求咋舌时，研究者们已经意识到：要让技术走出实验室，必须跨越三道门槛：

计算成本：原始方法需要训练数万个子网络
时间消耗：单次搜索周期长达数周
专业门槛：需要定制reward函数和搜索空间

2018年出现的权重共享策略（Weight Sharing）成为转折点。ENAS算法通过让所有子网络共享同一组权重，将搜索时间从28天压缩到10小时。这背后的技术精妙之处在于：

# 简化的权重共享实现逻辑 class SuperNet(nn.Module): def __init__(self): self.ops = nn.ModuleList([Conv3x3(), Conv5x5(), Pooling()]) # 可选项集合 def forward(self, x, arch_code): for block in arch_code: # arch_code编码架构选择 x = self.ops[block](x) # 动态路由 return x

与此同时，代理模型技术的引入让研究者能用小规模训练预测架构潜力。Google提出的"渐进式收缩"策略（Progressive Shrinking）将ImageNet上的搜索成本降低到仅需200TPU时，相当于用1/50的成本获得同等精度模型。

3. 移动端突围：MnasNet开启的软硬协同时代

2018年发布的iPhone XS搭载的神经引擎，让Tan等人意识到：移动端NAS必须考虑真实硬件特性。他们设计的MnasNet首次将延迟指标直接融入reward函数：

Reward = ACC(m)^α * [LAT(m)/T]^β

其中α=2, β=-0.07，T为目标延迟阈值

这种设计带来了三个突破性改变：

平台感知搜索：在Pixel手机实测每层操作延迟
异构模块化：自动平衡depthwise卷积与常规卷积比例
动态分辨率：根据输入复杂度调整处理路径

实测数据显示，MnasNet在Pixel手机上达到75.2% Top-1准确率时，延迟仅76ms，比人工设计的MobileNetV2快1.5倍。这直接推动了后续移动端NAS的三大设计范式：

延迟感知搜索：使用真实设备构建延迟查找表
功耗约束优化：引入能耗模型作为约束条件
芯片适配搜索：针对NPU指令集定制算子组合

4. 当代技术图景：多目标协同优化的新战场

今天的NAS技术早已超越单纯的架构搜索，形成了完整的技术生态链。2023年CVPR最佳论文候选之一的AutoFormer展现了新一代NAS的典型特征：

三阶段协同搜索：同时优化架构、训练策略和超参数
动态权重加载：支持运行时架构调整
跨平台适配：自动生成CPU/GPU/NPU专用变体

工业界应用也呈现出鲜明分野：

应用场景	典型需求	代表方案
移动端视觉	低延迟(<50ms)	MobileNetV3+NAS
云端大模型	计算密度优化	EfficientNet-B7
边缘计算	能耗约束	TinyNAS
实时视频处理	动态分辨率支持	SwiftNet