当前位置: 首页 > news >正文

GroundingDino针对航空图像检测的改进 MM Grounding Dino Large - MKT

https://arxiv.org/abs/2401.02361

image

 

image

 

image

 

测试数据集构建

针对无人机航拍特性,构建包含以下场景的测试集:

  • 城市航拍:建筑物、车辆、行人(分辨率3840×2160)
  • 乡村农田:农机、作物行、电线杆(分辨率2560×1440)
  • 灾害救援:倒塌建筑、救援车辆、幸存者(分辨率1920×1080)

image

 

典型案例分析
小目标检测能力:在300米高空拍摄的农田图像中(单个农机目标像素尺寸约20×30),模型实现89.7%的召回率,优于YOLOv8x的76.2%。通过可视化特征图可见,Swin-Large的stage4特征层(1/32下采样)仍能保留农机的关键轮廓信息。

类别泛化能力:对于训练集中未出现的"太阳能光伏板"类别,通过文本提示"a solar panel with blue cells",模型实现零样本检测mAP 37.5,验证了GOLD-G数据集带来的开放式词汇理解能力。

 

image

image

 

http://www.jsqmd.com/news/24080/

相关文章:

  • 人工智能十大数学知识 - 数理逻辑 - 何苦
  • 看了个介绍音频相关的视频有感,44100HZ 就是母带
  • GroundingDino目标跟踪+sam2分割 - MKT
  • 人工智能十大数学知识 - 复杂性理论 - 何苦
  • 人工智能十大数学知识 - 群论 - 何苦
  • 人工智能十大数学知识 - 离散数学 - 何苦
  • 人工智能十大数学知识 - 优化理论 - 何苦
  • 【解决方法】通过windows远程桌面连接centos stream10_基于xrdp(网上搜出来的路径里找不到startwm.sh)
  • 人工智能十大数学知识 - 图论 - 何苦
  • 人工智能十大数学知识 - 信息论 - 何苦
  • 人工智能十大数学知识 - 概率与统计学 - 何苦
  • 在服务器上直接从百度网盘下载文件
  • 25.10.27
  • 251028
  • 刷题日记—链表—快慢指针的应用
  • 【SHADER系列】(四)UGUI 渐变/平滑遮罩 SoftMask
  • 【SHADER系列】(四)UGUI 渐变/平滑遮罩 SoftMask
  • 刷题日记——链表—二进制转十进制,虚拟头结点
  • newDay16
  • Hamiltonian H
  • 透明代理和uups代理,哪个更省gas,为什么
  • 新学期每日总结(第14天)
  • 示性函数引入
  • 2025.10.27
  • go构建streamablehttp mcp服务
  • 算法分析--分治--2.归并排序
  • Vue2随笔-251027
  • Java: Jdk17 异步或同步或并行发邮件
  • Day5div与span标签以及字体实体
  • CCUT应用OJ题解——贪吃的松鼠