【YOLOv11】029、YOLOv11的推理优化:NMS、DIoU-NMS与快速推理技巧
昨天深夜调一个边缘设备上的YOLOv11模型,推理帧率死活上不去。用perf工具抓了一下热点,发现超过40%的时间卡在后处理上——又是NMS(非极大值抑制)这个老伙计在拖后腿。这让我想起三年前在产线调试检测模型时,同样被NMS坑过的经历。今天咱们就聊聊YOLOv11推理中这个关键环节的优化门道。
一、标准NMS为什么成了瓶颈?
先看一个最常见的NMS实现,很多开源项目里都能见到这种写法:
defnaive_nms(boxes,scores,threshold=0.5):keep=[]order