当前位置: 首页 > news >正文

深度可分离卷积

背景

深度可分离卷积最早可追溯到2014 年的 Xception 网络前身相关研究以及更早的轻量化卷积探索。
具体内容可以由读者自行探索,在本文不再详谈(其实是我写的时候我还没读QAQ)

原理

深度可分离卷积就是把传统的CNN“分解”为了深度卷积逐点卷积,下面将具体介绍以上两种卷积。

深度卷积

所谓深度卷积,字面意思可以理解为对图像中更深层次的内容进行卷积操作。传统的CNN处理图像时,一般选择不同卷积核大小、相同通道数量的卷积核进行卷积,深度卷积则是选择对图像上的每个通道单独进行卷积运算。
如图所示:

原图像为12×12×3,我们使用5×5×1的卷积核,对每个通道的图像进行卷积,随后对每个通道重新拼接,最终得到8×8×3的图像。

逐点卷积

顾名思义,我们使用点卷积核对图像进行遍历卷积,也就是使用1×1×3的卷积核对图像进行卷积,使用256个不同的卷积核,最终就能得到8×8×256的图像特征。

与传统CNN对比

对于传统CNN,我们对上图图像进行CNN特征提取,我们会选择256个553的卷积核对图像进行卷积操作提取特征,显然得到的卷积特征图也是8×8×256。
那深度可分离卷积与传统CNN的优势在哪?我们为什么要选择深度可分离卷积,我们可以由上述内容了解到,两种卷积方法都能得到类似的特征图像,也就是说,两者卷积后的结果其实是类似的,那么既然效果是一样的,在工程实践中,我们另一个考察的指标就是速度,我们就可以了解到,深度可分离卷积的优势其实是在参数量以及计算量上。
我们来计算一下两者的参数量和计算量。

传统CNN计算量

已知图像大小为12×12×3,卷积核大小为5×5×3,一共有256个卷积核,那么每个卷积核对图像进行卷积,得到的参数量为5×5×3×256,计算量为5×5×3×256×8×8=1228800

深度可分离卷积计算量

已知图像大小为12×12×3,深度可分离卷积分为两个阶段,使用5×5×1的深度卷积核进行卷积可以得到,参数量为5×5×3,计算量为5×5×3×8×8=4800。随后在逐点卷积阶段,使用256个1×1×3的卷积核进行逐点卷积,参数量为1×1×3×256,计算量为1×1×3×256×8×8,因此总计算量是5×5×3×8×8+1×1×3×256×8×8 = 4800+49152 = 53952。
显然,深度可分离卷积的计算量是极少的。

参考内容来源于腾讯云开发者社区,参考链接:https://cloud.tencent.com/developer/inventory/8193/article/1459538

http://www.jsqmd.com/news/609878/

相关文章:

  • CC2530开发入门:用IAR EW8051和SmartRF Flash Programmer烧录第一个Zigbee程序
  • 为什么你的API吞吐量卡在8k QPS?Span<T> + MemoryPool<T>组合拳让Kestrel直冲23k QPS(附压测报告)
  • 头歌实战 3-3 MongoDB 复杂条件查询与数据聚合技巧
  • 从OSG牛模型变黑说起:深入GL3渲染模式与Ubuntu 20.04下的图形开发环境调优
  • 双轴卷取分切机程序,PLC和触摸屏使用西门子smart200系列。 前后卷取双轴张力控制计算
  • eNSP启动AR报错码40终极排查指南:从Hyper-V冲突到虚拟网卡修复
  • IDEA+Maven环境下SuperMap iDesktopX二次开发避坑指南(附完整配置流程)
  • 别再让图片拖慢你的多模态模型了:手把手教你用Q-Former和PruMerge压缩视觉Token(附代码)
  • 避开STC8A8K64S4A12的ADC那些坑:配置寄存器、结果对齐与电压跟随器详解
  • C++ 继承(Inheritance)超详细讲解(含代码+原理+实战)
  • 免费降AI率网站哪个靠谱?2026年18款工具实测对比
  • Java RAG入门基础教程(非常详细),用LangChain4j构建问答系统看这篇就够了!
  • 从设计到仿真:FPGA转置型FIR滤波器的完整开发流程
  • Docker镜像拉取超时?5分钟搞定国内镜像源加速配置(附最新可用镜像列表)
  • STM32 DAC实现高质量音频播放(从8bit到16bit进阶)
  • 【笔记】企业级多智能体系统设计学习
  • 01-17-03 向前兼容的技术手段
  • 从零到一:用BurpSuite插件打造你的第一个HTTP请求“中间人” (基于Montoya API最新版)
  • CSS如何利用Less快速生成颜色渐变背景_使用混合函数生成多样渐变
  • AI 4小时黑进全球最安全系统
  • LangChain深度智能体实战:工作记忆、渐进式技能披露与纵深防御,揭秘高效可靠AI系统的构建秘诀!
  • RuoYi项目部署复盘:除了宝塔,这些配置细节才是稳定运行的关键
  • Claude Code通关手册(三):CLAUDE.md深度实战
  • 基于ESP32与PCM5102的Wi-Fi无损音频传输系统设计与实现
  • 豆包论文降AI最优解:14款工具实测SpeedAI领跑
  • Ovito不止能渲染:5个隐藏技巧帮你从LAMMPS结果中挖掘新发现(团簇分析/边界识别实战)
  • 2025届毕业生推荐的五大AI写作方案解析与推荐
  • 智能手环里的海拔数据准不准?拆解MEMS气压传感器的工作原理与校准
  • 从单容器到生产环境:手把手教你用Docker Compose编排iTop + 独立MySQL
  • 2026信息素养大赛编程题考点全揭秘!Scratch/Python/C++备考必看