当前位置: 首页 > news >正文

2025_NIPS_Open-World Drone Active Tracking with Goal-Centered Rewards

文章核心总结

本文针对开放世界无人机主动跟踪的基准缺失和复杂环境适应性问题,提出了首个开放世界无人机空对地主动跟踪基准DAT和强化学习方法GC-VAT。DAT提供24个城市级场景、高保真动力学模拟和数字孪生场景生成工具;GC-VAT通过目标中心奖励函数和课程式训练策略,实现了72%的模拟器跟踪成功率,在真实场景中也表现出强鲁棒性。

主要创新点

  1. 首个开放世界基准DAT:涵盖24个城市级场景,支持无人机和地面机器人两种追踪器,具备高保真动力学模拟和数字孪生无限场景生成功能,可模拟类人目标行为。
  2. 目标中心奖励函数(Goal-Centered Reward):基于图像平面投影偏差设计,解决固定视角限制问题,提供跨视角精确反馈,扩大无人机感知和移动范围。
  3. 课程式训练策略(Curriculum-Based Training):从简单无遮挡场景逐步过渡到复杂场景,结合领域随机化,提升模型收敛速度和复杂环境适应性。
  4. 多维度实验验证:在模拟器、真实图像和实体无人机上验证,涵盖跨场景、跨域(不同天气)、抗干扰(风、雨、遮挡)等测试,表现优于现有SOTA方法。

翻译部分(Markdown格式)

Abstract

无人机视觉主动跟踪(Drone Visual Active Tracking)旨在通

http://www.jsqmd.com/news/575378/

相关文章:

  • 如何永久保存微信聊天记录:WeChatMsg本地化解决方案
  • 突破ONU设备管理瓶颈:zteOnu实战指南——揭秘高效运维的核心方法
  • 国内开发者如何高效集成Nano Banana Pro与Sora2?——API中转站选型与实战避坑指南
  • 告别手动描图!用PCL+OpenCV从激光点云里自动抠出道路标线(附完整代码流程)
  • NaViL-9B企业知识图谱构建:从图文资料中自动抽取实体关系三元组
  • OpenClaw+千问3.5-9B组合优化:长文本处理技巧与实战
  • 基于Multisim与74系列芯片的汽车尾灯仿真系统设计
  • 零基础Android开发入门:借助快马AI生成你的第一个Hello World项目
  • Umi-OCR终极指南:免费开源离线文字识别工具完全攻略
  • PyTorch 2.8深度学习镜像应用:科研团队复现NeRF+Video扩散模型训练环境
  • XRDP实战:在Rocky Linux上搭建高效远程桌面环境
  • 从手机快充到车载电源:不同场景下,BOOST电感选型公式该怎么‘微调’?
  • 论文查重“侦探家”:好写作AI,为学术诚信保驾护航
  • 3个专业场景下的开源按键可视化工具应用指南
  • 30亿参数小钢炮!Llama-3.2-3B部署与多场景应用测评
  • 解锁Meshroom:7个颠覆认知的3D重建实用技巧
  • n8n 2.0汉化版+PostgreSQL持久化:一份给自动化运维小白的保姆级Docker部署避坑指南
  • 无线通信入门:用Python手把手实现LS、MMSE、LMMSE信道估计(附代码对比)
  • 生成式AI合规指南:企业如何应对《生成式人工智能服务管理办法》新规(附实操清单)
  • 消息队列 BrokerServer 核心逻辑:processConnection 与请求处理全解析
  • 4个实战步骤:ComfyUI-WanVideoWrapper视频生成全流程指南
  • TypeScript多线程实战:用Worker Threads提升Node.js性能的5个技巧
  • Vue若依框架下如何实现多Tab页共存?动态路由+时间戳实战教程
  • 3步打造你的AI角色世界:SillyTavern终极入门指南
  • 终极指南:ncmdumpGUI如何破解NCM格式跨平台播放难题
  • 3步解锁KeymouseGo:让自动化操作效率提升5倍的开源工具
  • SIP与H.323信令对比:5个实际案例教你选型企业VoIP方案
  • SA8155P平台QNX系统下Fastboot刷机避坑指南(附驱动安装与固件更新全流程)
  • N8N + PostgreSQL 数据持久化实战:Docker 部署避坑指南(附1Panel监控)
  • Open-AutoGLM体验:一句话让AI帮你搞定手机上的繁琐操作