当前位置: 首页 > news >正文

<span class=“js_title_inner“>YOLO卷不动了,目标检测还能这样发论文!</span>

YOLO实在卷不动了,不知道目标检测还有哪些baseline好用?不知道怎么选?

实际上DETR系列都是好选择,也一直很火。包括RT-DETR系列、DINO系列、D-FINE系列等,近来更是出现了很多新变体,像是DINOv3、RF-DETR……此外,RetinaNet、轻量化检测等,也是主流。而具体的选择,则需要结合任务的特点。比如速度要求高,可以选RT-DETR;精度要求高,可以考虑Co-DETR……

同时,想往这方向发论文的伙伴,还可以关注一些顶会新赛道:SAM+目标检测、Mamba+目标检测、扩散模型+目标检测、YOLO+多模态……纵观近2年的顶会,这些领域录用量都在上涨,且还不算卷!

为让大家能够紧跟领域前沿,早点发出自己的顶会,以上所提所有baseline和方向,我都给大家准备了配套的参考论文和源码,共145篇!

扫描下方二维码,回复「目检145」

免费获取全部论文合集及项目代码

RT-DETRv4: Painlessly Furthering Real-Time Object Detection with Vision Foundation Models

内容:这篇论文提出了RT-DETRv4,一个通过视觉基础模型(VFM)知识蒸馏来增强实时目标检测器的新框架。核心创新包括:1)深度语义注入器(DSI),将VFM的高层语义表示整合到检测器深层;2)梯度引导自适应调制(GAM),根据梯度范数比动态调整语义迁移强度。该方法在不增加推理开销的情况下,显著提升了DETR系列模型的性能,在COCO数据集上达到了新的SOTA水平。

D-FINED:REDEFINE REGRESSION TASK IN DETRS ASFINE-GRAINED DISTRIBUTION REFINEMENT

内容:这篇论文提出了D-FINE,一个通过重新定义DETR模型中边界框回归任务来实现出色定位精度的实时目标检测器。核心创新包括:1)细粒度分布细化(FDR),将回归过程从预测固定坐标转变为迭代细化概率分布,提供更精细的中间表示;2)全局最优定位自蒸馏(GO-LSD),通过自蒸馏将深层精炼的分布知识传递到浅层。该方法在COCO数据集上达到SOTA性能(D-FINE-X获得55.8% AP at 78 FPS),并能将各种DETR模型性能提升高达5.3% AP,且几乎不增加额外参数和训练成本。

扫描下方二维码,回复「目检145」

免费获取全部论文合集及项目代码

DEYOLO: Dual-Feature-Enhancement YOLO for Cross-Modality Object Detection

内容:这篇论文提出了DEYOLO,一种用于跨模态目标检测的双特征增强YOLO框架,专门解决低光照环境下的检测问题。核心创新包括:1)双语义增强通道权重分配模块(DECA)和双空间增强像素权重分配模块(DEPA),通过双重增强机制在特征空间聚合跨模态信息,减少两种模态间的相互干扰;2)双向解耦焦点机制,扩大骨干网络在不同方向的感受野。该方法在M3FD和LLVIP数据集上显著优于现有的融合检测方法,mAP50提升超过5%,且DECA和DEPA模块可作为即插即用组件应用于其他模型。

Mamba-YOLO-World: Marrying YOLO-World with Mamba for Open-Vocabulary Detection

内容:这篇论文提出了Mamba-YOLO-World,一种将YOLO-World与Mamba状态空间模型结合的开词汇目标检测方法。核心创新是MambaFusion路径聚合网络(MambaFusion-PAN),通过并行引导选择扫描(PGSS)和串行引导选择扫描(SGSS)算法,以线性复杂度O(N+1)实现全局引导感受野的多模态特征融合。实验表明,该方法在COCO和LVIS数据集上零样本和微调设置下均优于原始YOLO-World,在保持相当参数量和计算量的同时,AP提升0.4%-1.8%,且超越了现有开词汇检测SOTA方法。

扫描下方二维码,回复「目检145」

免费获取全部论文合集及项目代码


http://www.jsqmd.com/news/332513/

相关文章:

  • GEO服务商哪家适配10万预算?2026年实测TOP5与投入技巧
  • 【LangChain 之Chains 03】
  • 2026武汉高考文化课集训机构权威解析:合规筑基,实效赋能备考
  • 聚焦耐久性:2026年格宾石笼网厂家产品实测分析,锌铝合金石笼网/抗冲击抗腐蚀石笼网/六角石笼网,格宾石笼网厂家找哪家
  • 大学生寒假别去摇奶茶了!网络安全从小白到入门,从理论到操作的全流程指南
  • 2026人脸门禁生产厂家/服务商TOP5推荐:智慧门禁优质服务商权威榜单发布,场景适配技术成熟,助力场所安全高效管理
  • 特立妥珠单抗Telisotuzumab Vedotin副作用详解:间质性肺病与周围神经病变的监测与剂量调整
  • 基于深度学习YOLOv12的护目镜佩戴识别检测系统(YOLOv12+YOLO数据集+UI界面+登录注册界面+Python项目源码+模型)
  • 潍坊厚德地坪工程有限公司:专注地坪领域,打造环氧、金刚砂、聚氨酯地坪优质解决方案
  • 2026车牌识别生产厂家/服务商TOP5推荐:车牌识别优质服务商权威榜单发布,场景适配能力突出,助力智慧通行高效落地
  • AI大神的3小时大模型入门,几分钟看完干货(附教程)
  • 豆瓣评分 9.5,海外疯传,这本大模型书凭什么圈粉全球无数程序员?
  • P6015A 泰克Tektronix无源高压探头 40千伏
  • 2026年通信与对抗教学系统TOP榜:聚焦安徽白鹭电子科技的硬核实力
  • MySQL 事务:原理、操作与隔离级别深度解析
  • 论文AI率100%怎么降?2026年亲测有效的救命方案
  • 你的项目适合哪种架构?大模型4大应用模式深度解析与选择指南
  • 老老实实干一辈子程序员是没出息的!这本证书你早该学!
  • 有哪些好用的AI写论文的工具?精选7款一键生成论文的软件测评,知网万方查重丝滑秒过! - 掌桥科研
  • 微软新出的AI Agents课程太顶了,通宵刷完!
  • 12306技术中心总工程师谈抢票热
  • 探秘《Hands on Large Language Models》:开启大模型学习之旅(附教程)
  • 富达金属装饰板厂实力怎样?规模大的厂家推荐
  • 【小程序毕设全套源码+文档】基于微信小程序的借书驿站小程序设计与实现(丰富项目+远程调试+讲解+定制)
  • 降AI工具哪个有退款保障?2026年靠谱工具盘点
  • 2026年降AI工作流:3步搞定论文AIGC检测
  • DeepSeek+豆包+Kimi降AI指令有用吗?2026年实测告诉你真相
  • 2026武汉文化课培训学校权威榜单推荐!
  • 2026高职大数据管理与应用专业应届生学数据分析的技术价值分析
  • 2026年最新降AI攻略总结:一站搞定论文AIGC检测