当前位置: 首页 > news >正文

从频域视角重构空洞卷机

CVPR FADC:从频域视角重构空洞卷积!

论文原文 :https://arxiv.org/abs/2403.05369
代码:https://github.com/ying-fu/FADC
即插即用代码仓库:https://github.com/AITricks/AITricks
《Frequency-Adaptive Dilated Convolution》,专门解决语义分割中空洞卷积(Dilated Conv)两大痛点:网格伪影和高频丢失。从“频域”入手,效果拔群!
1️⃣ 核心痛点:空洞卷积的“硬伤”
空洞卷积虽然能扩大感受野,但因为采样点不连续,就像用筛子看世界:
网格效应:特征图会出现棋盘格一样的黑洞,导致信息断层。
高频丢失:因为采样太稀疏,物体边缘、纹理这些“高频细节”根本抓不住,分割出来边缘毛毛糙糙。
2️⃣ FADC:频率自适应,按需分配
为了解决这个问题,作者提出了 FADC:
原理:不像传统方法那样全图用一样的膨胀率,而是看人下菜碟。
机制:在边缘/纹理(高频区域),自动缩小膨胀率,密集采样保细节;在平滑背景(低频区域),自动增大膨胀率,稀疏采样抓上下文。
3️⃣ AdaKern:卷积核也能“分频”
普通的卷积核是固定的,容易“偏科”(通常偏向低频)。AdaKern 把它拆解了:
低频分量:负责平滑去噪。
高频分量:负责锐化边缘。
动态重组:根据输入特征,自动调整这两个分量的比例。想抓纹理就多加高频,想去噪就多加低频。
4️⃣ FreqSelect:特征去噪“滤网”
空洞卷积容易产生混叠噪声。FreqSelect 就像一个智能滤镜,它能识别出哪些高频信号是有用的边缘,哪些是讨厌的噪声,然后精准抑制噪声,让特征图更纯净。
5️⃣ 实验结果:涨点实锤
这套“频域组合拳”效果相当能打:
定量指标:在 ADE20K 数据集上,给 DeepLabV3+ 装上 FADC 后,mIoU 直接提升了 1.2% - 1.8%!这在分割领域可是巨大的提升。
视觉效果:看对比图,不仅“网格效应”完全消失了,而且细小物体的边缘切得非常锐利,不再断断续续。
总结:这篇论文的 FADC、AdaKern 都是非常优秀的即插即用模块,特别适合替换 DeepLab、ResNet 里的空洞卷积层,做分割、去噪的同学赶紧试试!
#计算机视觉 #科研 #深度学习 #深度学习与神经网络 #科研日常 #大模型 #频域 #语义分割 #论文 #科研学习

http://www.jsqmd.com/news/184031/

相关文章:

  • 400 Bad Request错误排查:Sonic API请求格式正确姿势
  • 构建可扩展的大数据领域数据架构
  • Keil5开发STM32F103前必做:芯片库添加入门讲解
  • JFlash下载调试实战案例:STM32芯片连接操作指南
  • 法国戛纳国际创意节Sonic案例入围技术类别决赛
  • 格鲁吉亚葡萄酒庄用Sonic虚拟酿酒师介绍酿造工艺
  • 用 Doris 实现大数据的可视化报表生成
  • Sonic技术支持邮箱与Telegram群组即时响应
  • 微PE官网工具辅助部署Sonic本地运行环境(Windows)
  • Keil5安装+STM32开发环境搭建实战案例
  • Keil5添加文件步骤详解:配合STM32标准外设库
  • Sonic模型安全防护:防止恶意上传与DDoS攻击
  • MobaXterm高效运维实战的技术文章大纲
  • 51单片机流水灯代码keil操作指南:新手快速上手
  • 抖音挑战赛#用Sonic让爸妈追星:用户创意作品展播
  • 手机和相机的区别是什么?
  • Keil uVision5中文支持设置通俗解释
  • [特殊字符]_Web框架性能终极对决:谁才是真正的速度王者[20260102165328]
  • 视频详情页右键另存为xxx.mp4,保存本地高清资源
  • 从零实现STM32串口115200波特率传输示例
  • 芬兰基础教育系统试验Sonic辅助特殊儿童语言康复
  • Sonic前端界面开发建议:Vue3 + Element Plus快速搭建
  • C#能否调用Sonic模型API?跨语言集成可行性分析
  • 从零实现I2C中断功能(TC3入门篇)
  • Nginx反向代理配置Sonic Web服务提升并发能力
  • 一文说清单通道ADC在CubeMX中的配置要点
  • c++环境下spidev0.0 read返回255:片选配置错误识别与修复
  • 未来升级方向:Sonic或将支持全身动作与手势模拟
  • Sonic数字人项目使用Redis缓存高频访问数据
  • “潮流追踪法”在考虑分布式电源接入的网损计算中的应用