当前位置：首页 > news >正文

动态标签分配策略：OTA, SimOTA, Task-Aligned Assigner

news 2026/7/19 11:54:12

深夜debug手记

凌晨两点，实验室的散热风扇嗡嗡作响。屏幕上，YOLOv5的损失曲线像心电图一样剧烈抖动——正样本太少，负样本压倒性优势，模型根本学不进去。手动调整anchor匹配阈值？调高了漏检，调低了误报。这已经不是第一次被标签分配问题卡住了。传统静态分配（像Max-IoU）太死板，它只看IOU大小，完全不管当前模型的能力和样本复杂度。是时候把动态标签分配策略彻底搞清楚了。

为什么静态分配不够用了？

早期的检测器（比如Faster R-CNN）用固定规则：anchor和gt的IoU大于0.7算正样本，小于0.3算负样本，中间那些直接扔掉。这套规则在数据集简单、目标稀疏时还行，但遇到密集场景就崩了。你想想，两个目标靠得近，它们的anchor必然重叠，按IoU硬分配肯定会有歧义——这个anchor到底该归谁？模型自己都没说话，规则就替它决定了，这不合理。

更本质的问题是：标签分配应该是个动态过程，要跟着模型训练状态走。模型初期识别能力弱，分配应该宽松些，多给点正样本引导；后期能力强了，再收紧标准，提高质量。这就是动态分配的核心思想——让模型参与决定它该学什么。

OTA：把分配变成优化问题

OTA（Optimal Transport Assignment）是第一个把最优传输理论用到标签分配上的方法。它把问题抽象成：有一批gt（货物）和一批anchor（仓库），怎么以最小成本把货物运到仓库？这里的“成本”是模型算出来的，比如分类损失+回归损失。

具体实现时，OTA会加两个约束：1）每个gt至少要匹配一定

查看全文

http://www.jsqmd.com/news/619764/