当前位置：首页 > news >正文

[深度学习网络从入门到入土] 拓展 - Inception

news 2026/7/3 21:44:09

[深度学习网络从入门到入土] 拓展 - Inception

个人导航

知乎：https://www.zhihu.com/people/byzh_rc

CSDN：https://blog.csdn.net/qq_54636039

注：本文仅对所述内容做了框架性引导，具体细节可查询其余相关资料or源码

参考文章：各方资料

文章目录

[深度学习网络从入门到入土] 拓展 - Inception
个人导航
Inception v1
- - - 1. 结构
Inception v2
- - - 1. 核心改动 A：BatchNorm 全面使用
    - 2. 核心改动 B：更“便宜”的大卷积（5×5 → 3×3 + 3×3）
Inception v3
- - - 1. 因式分解卷积（Factorized Convolutions）
    - 2. “Grid Size Reduction” 变得更讲究
    - 3. 正则与训练技巧更“配方化”
Inception v4 & Inception-ResNet
- - - 1. Inception-v4：把 v3 的思想“模块标准化”
    - 2. Inception-ResNet：把 Inception 模块放进残差框架
后续

Inception v1

论文: Going Deeper with Convolutions.

Inception v1源于GoogLeNet
同一层里“多尺度”并行提特征，而不是只靠堆深/堆宽

1. 结构

经典 4 路并行：

1×1（线性组合/提非线性）
1×1 → 3×3
1×1 → 5×5
3×3 maxpool → 1×1

最后Concat(通道拼接)

关键：大核(3×3/5×5)前先用 1×1降维，否则计算炸

Inception v2

论文: Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift.

Inception v2把 BN 系统性引入 Inception 的版本，常被叫BN-Inception

1. 核心改动 A：BatchNorm 全面使用

BN 带来：

更高学习率、更快收敛，同时有一定正则化效果
甚至在一些设置下可减弱对 Dropout 的依赖

2. 核心改动 B：更“便宜”的大卷积（5×5 → 3×3 + 3×3）

降计算同时保持感受野

在后续 v3 被系统化成“卷积分解/因式分解”的设计哲学

Inception v3

论文: Rethinking the Inception Architecture for Computer Vision.

把“省算力”做成一套系统规则，而不是局部小修小补

1. 因式分解卷积（Factorized Convolutions）

(a) 5×5 → 3×3 + 3×3（省算力+更多非线性）

(b) n×n → 1×n + n×1（非对称卷积）

例如3×3 → 1×3 + 3×1，或更大的7×7 → 1×7 + 7×1
这通常能显著减少计算，同时保持等效感受野

© 大 7×7 的进一步处理

论文明确提到“factorized 7×7”等变体设置

2. “Grid Size Reduction” 变得更讲究

v3 里下采样（特征图尺寸变小）不再只是粗暴 pooling/stride，

而是设计专门的 reduction block，避免信息瓶颈（同时控制计算量）

3. 正则与训练技巧更“配方化”

v3 论文讨论了多种训练设定/技巧（比如 label smoothing、BN-auxiliary）

Inception v4 & Inception-ResNet

论文: Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning.

1. Inception-v4：把 v3 的思想“模块标准化”

用更统一的Stem / Inception-A / Inception-B / Inception-C / Reduction-A / Reduction-B这套积木来搭

目标：更清晰、更可复现、更好调参

2. Inception-ResNet：把 Inception 模块放进残差框架

残差连接能明显加速 Inception 网络训练，并且在相近计算量下有时还能带来小幅收益

后续

到了 v4 后, Inception 已经发展到极限复杂度

且 ResNet 出现后，主流发展方向变成：

更深（50/101/152层）
更简单
更容易扩展

而 Inception：(工程上不如 ResNet 好扩展)

结构复杂
分支多
手工设计感强

AutoML 时代来了 -> 让算法自己搜索结构

Inception 属于人类精心设计的多分支结构

http://www.jsqmd.com/news/382747/

相关文章：

基于SpringBoot+Vue的社区旧衣物品回收与捐赠平台设计与实现

2026年吹膜机厂家推荐排行榜，实验型/小型/单层/双层/三层/五层/色母/多层共挤/降解材料吹膜机，实力品牌与创新技术深度解析 - 品牌企业推荐师（官方）

如何通过单北斗GNSS提升桥梁形变监测的准确性？

计算机毕业设计springboot高校资源共享平台基于SpringBoot的高等院校教学资源协同共享系统 SpringBoot框架下高校数字化学习资源互通服务平台

港大突破：VR驱动机器人实现类人动作学习

2026年集装箱房厂家实力推荐榜：住人/工地/可移动/折叠/临建集装箱房，源头工厂专业定制与创新设计深度解析 - 品牌企业推荐师（官方）

2026年切削液厂家实力推荐榜：防锈型/微乳化/全合成/铝合金/镁合金/玻璃磨削液等专业品类深度解析与选购指南 - 品牌企业推荐师（官方）

港大用AI视频生成技术让机器人拥有“透视眼“:首次实现超视野导航

2026大专大数据与会计专业学习数据分析的价值分析

深入解析Effective Modern C++条款35：基于任务与基于线程编程的哲学与实践

阿里Qwen团队首次提出P-GenRM：个性化大模型奖励机制的全新突破

ollama+tts+vlm+langchain 示例代码

[深度学习网络从入门到入土] 含并行连结的网络GoogLeNet

AI替代老农经验———全程种植方案，输入，地块，土壤，作物，处理，知识库匹配最优方案，输出，播种/施肥/打药全流程表。

一篇撞车的文章

2026情人节开启第一篇博客

langChain 大模型开发知识汇总

JMeter 简介 - 教程

基于微信小程序的“共享书角”图书借还管理系统毕设源码

2026年雷达塔厂家实力推荐榜：军用/海洋/边防/相控阵等全类型雷达塔，专业制造与创新技术深度解析 - 品牌企业推荐师（官方）

2026年电池防爆阀刻痕残厚测试仪厂家推荐榜单：全自动/锂电池防爆阀/刻痕深度/残厚测试仪，精准高效与安全可靠技术解析 - 品牌企业推荐师（官方）

《实时渲染》第3章-图形处理单元-3.4可编程着色和及其API的演变

高温隔热布产品哪家好？2026年十强厂商深度分析对比 - 资讯焦点

上海AI实验室携手港中文首创“隐喻星辰“：让AI读懂图像背后含义

旧物利用：如何用 GKD 将旧手机变成“全自动”远程看护？

流动于心，赋能于行——埃里克森创始人玛丽莲・阿特金森博士《流动》大陆简体版首发见面会圆满落幕 - 资讯焦点

eBay突破:让AI不再只是“看图说话“，而能真正理解电商世界的奥秘

知识图谱赋能AI原生应用：实现智能决策的关键技术

为什么现代 C++ 库都用 PIMPL？一场关于封装、依赖与安全的演进

2026年芯片封装厂家实力推荐榜：COB封装/金丝键合/铝线楔焊/BGA封装等核心技术深度解析与优质厂商盘点 - 品牌企业推荐师（官方）