当前位置: 首页 > news >正文

(aaai25) Dynamic Clustering Convolutional Neural Network

核心目标: 在避免过度增加计算成本的前提下,突破局部窗口建模的限制,实现高效的全局特征提取。

核心思想: 通过全局聚类将语义相似的图像块分组为簇,再对每个簇使用共享卷积核进行卷积操作。既保留 CNN 的归纳偏置和计算效率,又获得类似 Transformer 的全局建模能力。

如图所示,主要包括五个步骤:

  • 图像分块与聚类中心初始化:将输入图像转换为 H×W 个图像块,每个块均作为潜在聚类中心,并通过可学习参数将原始块特征转换为聚类中心特征向量(下方黄色特征)。
  • 提取特征向量子向量: 提取特征向量的子向量进行距离计算(采样间隔 d 设为 8),可以降低高分辨率图像处理的计算成本(上方绿色向量)。
  • 全局动态聚类:计算每个聚类中心与特征向量子向量的 L₂范数距离,通过 Top-K 算法选择距离最近的 K-1 个块,与聚类中心共同组成大小为 K 的簇。
  • 得到N个簇: 使用 IndexSelect 从聚类中心向量中选择,最终形成 H×W = N 个全局分布的簇。
  • 簇上卷积操作:对每个簇采用共享卷积核执行分组卷积(借鉴深度可分离卷积思想),平衡参数数量与计算效率,生成新的特征图。

实验部分可以参考作者论文,这里不过多介绍。

http://www.jsqmd.com/news/198474/

相关文章:

  • 开源阅读鸿蒙版终极指南:从零基础到高效使用的完整教程
  • 3分钟快速搞定Figma中文界面:免费插件完全汉化指南
  • 揭秘R语言时间序列季节性检测:5步精准识别周期模式
  • springboot的毕业设计选题系统vue
  • AI-Shoujo HF Patch v2.25 终极技术解析与实战指南
  • 理解回表查询
  • springboot社区养老志愿者-服药 一键呼叫vue
  • 大麦网自动化购票系统:基于脚本的高效抢票方案
  • R语言GPT可视化实战(AI驱动的数据图形革命)
  • 第21届智能车竞赛教程:从入门到“棋赛”
  • 【深度收藏】2026AI就业指南:大模型算法工程师月薪2.5万,数学能力成“硬通货“,应届生如何备战AI人才争夺战
  • 3分钟搞定Figma界面汉化:设计师必备的中文翻译神器
  • R语言空间数据分析(空间权重矩阵构建全攻略)
  • Windows直读Btrfs分区终极方案:WinBtrfs跨平台文件共享完整指南
  • 2026长沙心理咨询机构哪家专业?实力机构推荐 - 品牌排行榜
  • 自由模式下保留原始韵律节奏,适合散文诗歌类朗读
  • 别再乱用logit了!,R语言中链接函数选择的7大陷阱与避坑方案
  • 碧蓝航线Live2D资源提取神器:轻松获取精美角色模型
  • DownGit:GitHub精准下载神器,三步搞定文件夹打包下载
  • 新手引导设计帮助用户快速完成第一次合成
  • Xiaomusic完整指南:让小爱音箱变身智能音乐管家
  • Obsidian代码块美化插件终极指南:3步打造专业级技术笔记
  • WorkshopDL技术深度解析:跨平台Steam模组下载机制与实践指南
  • AI-Shoujo HF Patch v2.25:开启全新游戏体验的创意引擎
  • OpenCore Legacy Patcher技术解析:让老旧Mac设备重获新生的完整解决方案
  • Kodi自动字幕下载插件:解决观影无字幕困扰的终极指南
  • 3分钟学会MediaCreationTool.bat:一键搞定Windows系统部署
  • vscode中调用deepseek实现AI辅助编程
  • 2026年西安写字楼租赁、高端办公 TOP10 优选:超甲标杆与品质空间合集 - 深度智识库
  • AI-Shoujo HF Patch v2.25 技术深度解析:从基础到高级应用