当前位置: 首页 > news >正文

[深度学习网络从入门到入土] 拓展 - Inception

[深度学习网络从入门到入土] 拓展 - Inception

个人导航

知乎:https://www.zhihu.com/people/byzh_rc

CSDN:https://blog.csdn.net/qq_54636039

注:本文仅对所述内容做了框架性引导,具体细节可查询其余相关资料or源码

参考文章:各方资料

文章目录

  • [深度学习网络从入门到入土] 拓展 - Inception
  • 个人导航
  • Inception v1
        • 1. 结构
  • Inception v2
        • 1. 核心改动 A:BatchNorm 全面使用
        • 2. 核心改动 B:更“便宜”的大卷积(5×5 → 3×3 + 3×3)
  • Inception v3
        • 1. 因式分解卷积(Factorized Convolutions)
        • 2. “Grid Size Reduction” 变得更讲究
        • 3. 正则与训练技巧更“配方化”
  • Inception v4 & Inception-ResNet
        • 1. Inception-v4:把 v3 的思想“模块标准化”
        • 2. Inception-ResNet:把 Inception 模块放进残差框架
  • 后续

Inception v1

论文: Going Deeper with Convolutions.

Inception v1源于GoogLeNet
同一层里“多尺度”并行提特征,而不是只靠堆深/堆宽

1. 结构

经典 4 路并行:

  • 1×1(线性组合/提非线性)
  • 1×1 → 3×3
  • 1×1 → 5×5
  • 3×3 maxpool → 1×1

最后Concat(通道拼接)

关键:大核(3×3/5×5)前先用 1×1降维,否则计算炸

Inception v2

论文: Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift.

Inception v2把 BN 系统性引入 Inception 的版本,常被叫BN-Inception

1. 核心改动 A:BatchNorm 全面使用

BN 带来:

  • 更高学习率、更快收敛,同时有一定正则化效果
  • 甚至在一些设置下可减弱对 Dropout 的依赖
2. 核心改动 B:更“便宜”的大卷积(5×5 → 3×3 + 3×3)

降计算同时保持感受野

在后续 v3 被系统化成“卷积分解/因式分解”的设计哲学

Inception v3

论文: Rethinking the Inception Architecture for Computer Vision.

把“省算力”做成一套系统规则,而不是局部小修小补

1. 因式分解卷积(Factorized Convolutions)

(a) 5×5 → 3×3 + 3×3(省算力+更多非线性)

(b) n×n → 1×n + n×1(非对称卷积)

例如3×3 → 1×3 + 3×1,或更大的7×7 → 1×7 + 7×1
这通常能显著减少计算,同时保持等效感受野

© 大 7×7 的进一步处理

论文明确提到“factorized 7×7”等变体设置

2. “Grid Size Reduction” 变得更讲究

v3 里下采样(特征图尺寸变小)不再只是粗暴 pooling/stride,

而是设计专门的 reduction block,避免信息瓶颈(同时控制计算量)

3. 正则与训练技巧更“配方化”

v3 论文讨论了多种训练设定/技巧(比如 label smoothing、BN-auxiliary)

Inception v4 & Inception-ResNet

论文: Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning.

1. Inception-v4:把 v3 的思想“模块标准化”

用更统一的Stem / Inception-A / Inception-B / Inception-C / Reduction-A / Reduction-B这套积木来搭

目标:更清晰、更可复现、更好调参

2. Inception-ResNet:把 Inception 模块放进残差框架

残差连接能明显加速 Inception 网络训练,并且在相近计算量下有时还能带来小幅收益

后续

到了 v4 后, Inception 已经发展到极限复杂度

且 ResNet 出现后,主流发展方向变成:

  • 更深(50/101/152层)
  • 更简单
  • 更容易扩展

而 Inception:(工程上不如 ResNet 好扩展)

  • 结构复杂
  • 分支多
  • 手工设计感强

AutoML 时代来了 -> 让算法自己搜索结构

Inception 属于人类精心设计的多分支结构

http://www.jsqmd.com/news/382747/

相关文章:

  • 基于SpringBoot+Vue的社区旧衣物品回收与捐赠平台设计与实现
  • 2026年 吹膜机厂家推荐排行榜,实验型/小型/单层/双层/三层/五层/色母/多层共挤/降解材料吹膜机,实力品牌与创新技术深度解析 - 品牌企业推荐师(官方)
  • 如何通过单北斗GNSS提升桥梁形变监测的准确性?
  • 计算机毕业设计springboot高校资源共享平台 基于SpringBoot的高等院校教学资源协同共享系统 SpringBoot框架下高校数字化学习资源互通服务平台
  • 港大突破:VR驱动机器人实现类人动作学习
  • 2026年集装箱房厂家实力推荐榜:住人/工地/可移动/折叠/临建集装箱房,源头工厂专业定制与创新设计深度解析 - 品牌企业推荐师(官方)
  • 2026年切削液厂家实力推荐榜:防锈型/微乳化/全合成/铝合金/镁合金/玻璃磨削液等专业品类深度解析与选购指南 - 品牌企业推荐师(官方)
  • 港大用AI视频生成技术让机器人拥有“透视眼“:首次实现超视野导航
  • 2026大专大数据与会计专业学习数据分析的价值分析
  • 深入解析Effective Modern C++条款35:基于任务与基于线程编程的哲学与实践
  • 阿里Qwen团队首次提出P-GenRM:个性化大模型奖励机制的全新突破
  • ollama+tts+vlm+langchain 示例代码
  • [深度学习网络从入门到入土] 含并行连结的网络GoogLeNet
  • AI替代老农经验———全程种植方案,输入,地块,土壤,作物,处理,知识库匹配最优方案,输出,播种/施肥/打药全流程表。
  • 一篇撞车的文章
  • 2026情人节开启第一篇博客
  • langChain 大模型开发知识汇总
  • JMeter 简介 - 教程
  • 基于微信小程序的“共享书角”图书借还管理系统毕设源码
  • 2026年 雷达塔厂家实力推荐榜:军用/海洋/边防/相控阵等全类型雷达塔,专业制造与创新技术深度解析 - 品牌企业推荐师(官方)
  • 2026年电池防爆阀刻痕残厚测试仪厂家推荐榜单:全自动/锂电池防爆阀/刻痕深度/残厚测试仪,精准高效与安全可靠技术解析 - 品牌企业推荐师(官方)
  • 《实时渲染》第3章-图形处理单元-3.4可编程着色和及其API的演变
  • 高温隔热布产品哪家好?2026年十强厂商深度分析对比 - 资讯焦点
  • 上海AI实验室携手港中文首创“隐喻星辰“:让AI读懂图像背后含义
  • 旧物利用:如何用 GKD 将旧手机变成“全自动”远程看护?
  • 流动于心,赋能于行——埃里克森创始人玛丽莲・阿特金森博士《流动》大陆简体版首发见面会圆满落幕 - 资讯焦点
  • eBay突破:让AI不再只是“看图说话“,而能真正理解电商世界的奥秘
  • 知识图谱赋能AI原生应用:实现智能决策的关键技术
  • 为什么现代 C++ 库都用 PIMPL?一场关于封装、依赖与安全的演进
  • 2026年 芯片封装厂家实力推荐榜:COB封装/金丝键合/铝线楔焊/BGA封装等核心技术深度解析与优质厂商盘点 - 品牌企业推荐师(官方)