【RT-DETR实战】142、模型跑得欢,指标怎么看?聊聊那些让你又爱又恨的评估数字
昨天深夜调一个RT-DETR的变体模型,推理结果肉眼看着挺准,但一上测试集mAP直接掉了5个点。
同事凑过来看了一眼说:“你FPS上去了,但mAP崩了,这买卖划算吗?” 这话让我愣了半天——我们到底该用什么尺子量模型?
mAP:别被一个数字骗了
mAP这玩意儿,新手容易盯着那个最终数字较劲。我早期就犯过这错:某个类别的AP冲到0.9,整体mAP看着漂亮,实际部署时某个关键类别漏检得一塌糊涂。
# 计算每个类别的AP,这里有个细节要注意forcls_idinrange(num_classes):# 按置信度排序预测框sorted_indices=np.argsort(