当前位置：首页 > news >正文

YOLO26涨点改进 | ECCV 2024 | 独家创新-注意力改进篇| YOLO26引入AgentAttention代理注意力模块，减少计算复杂度，同时保留全局上下文建模能力，提高目标检测精度

news 2026/6/24 14:47:39

一、本文介绍

🔥本文给大家介绍使用Agent Attention模块改进YOLO26网络模型。其主要作用是通过引入高效的代理token来减少计算复杂度，同时保留全局上下文建模能力。相比传统的Softmax注意力，Agent Attention通过代理token聚合并广播信息，从而降低了模型在处理高分辨率图像时的计算负担，并显著提高了推理速度。其优势在于保持了目标检测中的全局信息处理能力，同时加速了生成过程，特别是在高分辨率场景下，可以提高检测精度、减少内存消耗，并提升处理速度。

🔥欢迎订阅我的专栏、带你学习使用最新-最前沿-独家YOLO26创新改进！🔥

YOLO26专栏改进目录：全新YOLO26改进专栏包含卷积、主干网络、各种注意力机制、检测头、损失函数、Neck改进、小目标检测、二次创新模块、多种组合创新改进、全网独家创新等创新点改进

全新YOLO26专栏订阅链接：全新YOLO26创新改进高效涨点+永久更新中（至少500+改进）+高效跑实验发论文

本文目录

一、本文介绍

二、Agent Attention模块介绍

2.1 Agent Attention模块结构图

2.2 Agent Attention模块的作用：

2.3 Agent Attention模块的优势：

2.4 Agent Attention模块的原理：

三、完整核心代码

四、手把手教你配置模块和修改tasks.py文件

1.首先在ultralytics/nn/newsAddmodules创建一个.py文件

2.在ultralytics/nn/newsAddmodules/__init__.py中引用

3.修改tasks.py文件

五、创建涨点yaml配置文件

🚀 创新改进1 : yolo26_AgentAttention.yaml

🚀 创新改进2 : yolo26_C2PSA_AgentAttention.yaml

六、正常运行

二、Agent Attention模块介绍

摘要：注意力模块是Transformer架构的核心组件。虽然全局注意力机制具有强大的表征能力，但其过高的计算成本限制了其在多种场景中的应用。本文提出了一种新型注意力范式——代理注意力（Agent Attention），旨在实现计算效率与表征能力之间的最佳平衡。具体而言，代理注意力通过引入四元组（Q，A，K，V）的形式，在传统注意力模块中新增了一组代理标记A。这些代理标记首先作为查询标记Q的代理，从K和V中聚合信息，随后将信息反馈给Q。由于代理标记的数量可以设计得远少于查询标记数量，代理注意力在保持全局上下文建模能力的同时，显著优于广泛采用的Softmax注意力机制。有趣的是，我们证明了所提出的代理注意力等同于线性注意力的广义形式。因此，代理注意力实现了软性线性注意力的强大性能与线性注意力高效性的无缝融合。大量实验表明，代理注意力在各类视觉Transformer架构及图像分类、目标检测、语义分割、图像生成等多样化视觉任务中均展现出优异效果。值得注意的是，得益于其线性注意力特性，代理注意力在高分辨率场景中表现尤为突出。例如，当应用于Stable Diffusion时，我们的注意力机制无需额外训练即可显著提升图像生成速度和质量。

查看全文

http://www.jsqmd.com/news/716649/