当前位置: 首页 > news >正文

slam 对比(1)mast3r orbslam3 droid-slam - MKT

slam 对比(1)mast3r orbslam3 droid-slam

 

1 第一帧直接设成单位位姿

2 跑一次轻量更新网络估一个近似光流 delta 只用来判断运动是否够大,挑选关键帧加入窗口

3 新关键帧的位姿初值

先把新帧位姿直接拷贝成上一帧位姿,深度初值用前几帧视差的中位数

如果开了 motion_damping,它还会用最近两帧估一个速度,在 SE3 李代数里外推下一帧位姿

4相邻帧之间的约束怎么建立

主要是邻近帧和几何上接近的帧

每条边 (i, j) 加进去时,会先根据当前位姿和深度,把 i 帧像素重投影到 j 帧,得到初始目标坐标 target

这一步的含义是:

- 不是直接输出位姿
- 而是先根据当前 pose + depth 猜“像素应该投到哪里”

4网络实际上预测的是什么

DROID 的更新网络不直接回归 SE3。它预测的是:

- delta:像素坐标修正量
- weight:每个像素残差权重
- eta/damping:BA 的阻尼/先验项

image

 

image

 

image

 

image

 

问题1\

ASt3R-SLAM 也是强学习先验系统,不是传统几何链路。
- 它自己的论文就承认两件事:3D geometry 预测会有 inconsistencies and correlated errors,而且 scale is often a large source of inconsistency across predictions。这和你看到的“夜间无人机数据上整体偏了”是很一致的。来源:CVPR2025 论文 PDF 第 2-3 页,MASt3R-SLAM paper
详细说名,针对无人机夜间俯拍120米高度的单目视觉定位影响是什么,同一个轨迹白天就稳定,晚上路灯就扭曲

 

是的,你这个现象和 MASt3R-SLAM 的方法特性是对得上的。它不是传统“显式几何前端 + BA 后端”那种链路,而是先用 MASt3R
这种两视图 3D 重建先验,直接给出 pointmap、匹配和置信度,再靠后端把这些预测拼成全局一致结果。论文自己明确承认两
点:3D 几何预测会有“inconsistencies and correlated errors”,而且“scale 往往是跨预测不一致的重要来源”。这意味着它
的误差不是独立噪声,而可能是一整片区域一起偏。

对“无人机夜间 120 米单目俯拍”来说,这正好是这种系统比较脆弱的工况。下面这部分是我基于论文表述和你这个成像条件做的
工程推断。

对你这个工况的具体影响

1. 尺度更容易飘
在 120 米高度下,俯拍地面的有效视差本来就弱。相邻帧如果只平移 1 到 3 米,基线/景深比只有大约 0.8% 到 2.5%。单
目又没有真实绝对尺度,MASt3R-SLAM 虽然能给出“像是有尺度”的 3D,但论文也说它们跨帧 scale 常不一致,所以晚上会更
容易出现“整段轨迹被拉长、压缩、局部缩放突变”。
2. 平面位置会整体偏,不只是局部抖
俯拍 120 米时,场景大多接近大平面,道路、屋顶、停车场这些区域对几何解是退化的。白天还能靠纹理、边缘、阴影、建
筑轮廓补充约束;夜间大量区域变成黑块,只剩路灯、灯带、反光点最显眼。结果就是系统会把很少量的高亮区域当成主要几
何依据,错了就不是一个点错,而是整块地面一起被“带偏”。
3. 航向和横向定位更容易被灯带拖偏
路灯在俯拍下经常形成重复模式:一排排等间距亮点、道路中线反光、十字口高亮斑。这种重复结构对白天纹理丰富场景影响
不大,但夜间它们会主导匹配。于是系统可能把“这一排灯”和“另一排很像的灯”对上,表现成:

- 沿道路方向的轨迹被拉直或拉弯
- 横向漂移到路中心线/灯带一侧
- 转弯口附近 yaw 突变或缓慢偏转

4. 局部地图会在路灯附近发生“橡皮布”形变
你说“晚上路灯就扭曲”,这个描述很像 correlated errors 的表现。因为路灯不是稳定 Lambertian 纹理点,而是高亮、饱
和、带光晕,还会受曝光、压缩、运动模糊、滚动快门影响,形状和中心会变。强学习先验会把这些亮点周围的上下文一起解
释成某种 3D 结构,所以你看到的往往不是一个灯错位,而是灯附近整块路面、路口、楼顶边缘一起鼓起、塌陷或扭斜。
5. 后端优化只能“自洽地错”,不一定能纠正
MASt3R-SLAM 后端确实会做全局优化,但如果前端 pairwise 预测在夜间已经系统性偏了,而且偏差还是相关的,后端通常只
能找到一个“整体最一致”的错误解,而不是回到真实几何。于是你看到的常常不是帧间完全跟丢,而是“相对还挺稳,但整条
轨迹整体偏了”。

 

 

为什么同一条轨迹白天稳、晚上扭曲

白天稳,通常不是因为算法 suddenly 变成了传统几何,而是因为白天满足了这个强先验系统更需要的条件:

- 地面和建筑有连续纹理,约束分布在整张图上,不会被少数亮点主导。
- 曝光更线性,边缘位置稳定,pointmap 和匹配的一致性更好。
- 白天外观更接近训练分布里的常见视觉模式,网络先验更容易给出互相兼容的几何。
- 俯拍大平面本来就几何弱,白天靠“广泛、均匀、稳定”的纹理勉强把它撑住;晚上这些支撑几乎没了,只剩灯。

所以本质上不是“夜晚特征少”这么简单,而是:

夜间把少数不稳定高亮结构变成了主导观测,强学习先验再把这些观测扩散成整片几何偏差,最后表现为尺度飘、轨迹弯、路灯
附近地图扭曲。

跟传统几何链路的差别

传统几何链路在这种场景也会难,但它更常见的失败是:

- 特征数掉下去
- 跟踪中断
- 局部漂移上升

而强学习先验链路的额外风险是:

- 它可能“看起来还能跑”
- 但输出的是带系统偏差的 dense geometry
- 错误会跨像素、跨局部窗口相关联
- 最终变成全局一致但物理上不准的轨迹

这和你说的“夜间无人机数据上整体偏了”非常一致。

如果把影响落到定位指标上

你最该担心的是这几项:

- ATE / 全局位置误差 夜间会明显增大,尤其是长直道路段和灯带密集区。
- 相对位姿短时稳定但长程偏差大,也就是局部看着平滑,回看全局发现整段偏了。
- 尺度一致性变差,速度估计、轨迹长度、回环对齐都会受影响。
- 重定位/回环 在夜间相似灯带场景下更容易出现错误闭环或闭不上环。

来源:

- CVPR 2025 论文主页:

https://openaccess.thecvf.com/content/CVPR2025/html/Murai_MASt3R-SLAM_Real-Time_Dense_SLAM_with_3D_Reconstruction
_Priors_CVPR_2025_paper.html
- 论文 PDF:

https://openaccess.thecvf.com/content/CVPR2025/papers/Murai_MASt3R-SLAM_Real-Time_Dense_SLAM_with_3D_Reconstructi
on_Priors_CVPR_2025_paper.pdf

如果你要,我下一条可以继续直接给你两部分内容之一:

1. 针对“夜间 120 米俯拍”画一张失效机理图
2. 结合 DROID-SLAM / ORB-SLAM3 / MASt3R-SLAM,按“为什么白天稳、晚上崩”做一版对比分析

 

问题2 mast3r 回环检测

 

http://www.jsqmd.com/news/679504/

相关文章:

  • 2026西南地区好用按摩椅:家用按摩椅品牌、家用按摩椅生产厂家、家用的按摩椅、性价比高的家用按摩椅、性价比高的按摩椅选择指南 - 优质品牌商家
  • Docker buildx实战速成:7步完成x86_64→ARM64→RISC-V三架构镜像构建,含buildkitd调优参数与内存泄漏修复
  • Revo Uninstaller:彻底解决软件卸载不干净与顽固程序残留的实用教程
  • 保姆级教程:将老旧监控RTSP流转换成HLS(m3u8),用Video.js在Vue/Web网页无插件播放
  • 大一新生也能玩转的智能车:手把手教你用STC8A8K和L9110S搭建电磁循迹小车(附PCB文件)
  • 番茄小说下载器终极指南:一站式构建你的个人离线书库
  • RisohEditor:免费Win32资源编辑器解决exe图标修改与对话框编辑难题
  • 拆解一个Keil DFP Pack包:除了HAL库,STM32F4的包里还藏了哪些宝藏?
  • 别再怕手机丢了!手把手教你将Google身份校验器的OTP密钥备份到Web服务(Spring Boot + Docker实战)
  • GD32F450的14个Timer怎么选?高级/通用/基本定时器区别与PWM应用场景全解析
  • 如何用SQL按条件计算移动求和_结合CASE与窗口函数
  • 09华夏之光永存:(开源)华夏本源大模型·保姆级完整版(无废话·一键部署)
  • 小白程序员必备!收藏这篇,轻松玩转Claude Skills,开启AI高级玩法
  • 保姆级教程:在Ubuntu 18.04上为爱芯元智AX630A编译Linux系统镜像(含完整依赖包清单)
  • Harness 中的动态批处理:合并多个轻量请求
  • MyBatisPlus条件构造器避坑指南:为什么你的eq查询有时会漏数据?
  • 保姆级教程:用Python的data_downloader包搞定Sentinel-1精密轨道数据下载(含NASA账号配置)
  • 告别‘找不到磁盘’:用ESXi-Customizer-PS为任意品牌服务器定制带驱动的ESXi 6.7安装镜像
  • Tsukimi播放器技术深度解析:Rust与GTK4构建的现代化媒体中心架构
  • 收藏!2026年85%企业必做AI大模型应用,程序员/小白入门必看
  • VisionMaster脚本模块实战:用C#实现条码识别结果自动写入日志文件
  • 从‘仅追加’到‘伪更新’:深入拆解Elasticsearch Data Streams的底层机制与灵活操作
  • STM32 HAL库实战:PWM输出在写Flash时如何避免舵机抖动?一个真实案例的两种解法
  • 别扔!手把手教你用U盘和Telnet救活WD MyCloud Gen2变砖(保姆级图文教程)
  • 从一条CAN报文说起:深入理解J1939多帧传输(BAM/TP.DT)的底层逻辑与抓包分析
  • 全面掌控英雄联盟游戏体验:基于LCU API的智能自动化工具集深度解析
  • 收藏|2026最新版大语言模型(LLM)系统化学习路线,小白程序员都适用
  • DataGrip连接MySQL报错‘无效时区’?5分钟搞定配置并解锁它的SQL智能补全
  • CN3392 PFM 升压型双节锂电池充电控制集成电路
  • 强化学习核心算法与工程实践全解析