当前位置：首页 > news >正文

从滤波到优化：手把手拆解VIO算法核心，看懂OpenVINS的MSCKF和ORB-SLAM3的BA到底差在哪

news 2026/6/27 8:56:01

从滤波到优化：手把手拆解VIO算法核心，看懂OpenVINS的MSCKF和ORB-SLAM3的BA到底差在哪

视觉惯性里程计（VIO）技术近年来在机器人导航、增强现实等领域展现出强大的生命力。对于开发者而言，理解不同技术流派的核心差异，远比记住几个算法名字更有价值。本文将聚焦OpenVINS和ORB-SLAM3这两个代表性框架，深入剖析滤波与优化方法在VIO实现中的本质区别。

1. 状态估计的两大流派：滤波与优化

在VIO领域，状态估计方法主要分为滤波和优化两大阵营。滤波方法以卡尔曼滤波为代表，通过预测-更新的递推方式处理传感器数据；而优化方法则基于批量非线性优化，通过最小化重投影误差来求解状态。

滤波方法的核心特点：

递推式处理：每次只处理当前时刻的观测
马尔可夫性假设：当前状态只依赖于前一时刻状态
计算效率高，适合实时系统

优化方法的核心特点：

批量处理：同时优化多个时刻的状态
利用历史观测信息构建全局一致性
精度更高，但计算量相对较大

提示：虽然理论上滤波和优化在理想条件下能达到相同精度，但实际实现中的各种近似会导致性能差异。

2. OpenVINS的MSCKF：滤波方法的典型实现

OpenVINS采用了多状态约束卡尔曼滤波（MSCKF）作为其核心算法。这种滤波方法通过维护一个滑动窗口内的多个相机状态，利用特征点在多个帧间的观测构建几何约束。

2.1 MSCKF的核心机制

MSCKF的关键创新在于：

状态扩增：维护一个包含多个相机位姿的状态向量
特征参数化：使用逆深度等参数化方式表示路标点
观测压缩：将多个观测压缩为一个等效观测，减少计算量

// MSCKF状态向量示例 StateVector { IMU状态: [位置, 速度, 姿态, 陀螺仪bias, 加速度计bias] 相机状态: [位姿1, 位姿2, ..., 位姿N] }

2.2 FEJ：保持线性化一致性

MSCKF采用首次估计雅可比（FEJ）技术来解决滤波器的线性化不一致问题。FEJ的核心思想是：

对所有观测使用相同的线性化点
避免重复线性化带来的误差
保持信息矩阵的一致性

FEJ实现效果对比：

方法	线性化点选择	计算复杂度	一致性保持
标准EKF	当前估计值	低	差
FEJ-EKF	首次估计值	中	好
滑动窗口优化	多次线性化	高	最优

3. ORB-SLAM3的BA：优化方法的精妙设计

ORB-SLAM3采用基于图优化的方法，通过捆绑调整（BA）来实现状态估计。其核心是通过构建视觉重投影误差和IMU预积分误差的联合优化问题。

3.1 BA的数学表达

ORB-SLAM3的优化问题可以表示为：

min_{X} (∑||z_vision - h_vision(X)||^2_Σv + ∑||z_imu - h_imu(X)||^2_Σi)

其中：

X包含所有待优化状态（位姿、速度、bias、路标点）
h_vision和h_imu分别是视觉和IMU的观测模型
Σv和Σi是各观测的协方差矩阵

3.2 边缘化策略

ORB-SLAM3采用边缘化来处理历史信息：

将旧状态转换为先验信息
保留其对当前状态的影响
避免直接优化所有历史状态

边缘化实现步骤：

构建包含待边缘化状态的Hessian矩阵
进行Schur补操作得到边缘化后的先验
将先验信息加入后续优化问题

4. 滤波与优化的本质差异

虽然MSCKF和BA在理论上等价，但实际实现中存在几个关键差异点：

4.1 线性化处理方式

特性	MSCKF	BA
线性化次数	单次	多次
线性化点	固定	迭代更新
一致性	依赖FEJ	自然保持

4.2 历史信息利用

MSCKF的处理方式：

滑动窗口内状态直接估计
窗口外信息通过边缘化丢弃
信息利用率较低

BA的处理方式：

通过边缘化保留历史信息影响
构建更完整的概率图模型
信息利用率高

4.3 计算效率对比

在EuRoC数据集上的实测表现：

指标	OpenVINS	ORB-SLAM3
平均处理时间	15ms	45ms
内存占用	较低	较高
CPU利用率	更均衡	有峰值

5. 实际应用中的选择建议

根据我们在多个实际项目中的经验，滤波和优化方法各有最适合的场景：

选择MSCKF当：

硬件资源有限
需要极高实时性
运动较为平缓

选择BA当：

追求最高精度
有足够计算资源
运动复杂多变

一个实用的折中方案是采用基于优化的紧耦合VIO作为前端，配合滤波方法进行状态预测，这样既能保证精度，又能满足实时性要求。

查看全文

http://www.jsqmd.com/news/663505/

AI代码配额=新型IT预算？2026奇点大会披露：头部企业已将配额消耗纳入DevOps成本中心KPI（含真实财务映射表）

从IoU到EIoU：目标检测边界框回归损失函数的演进与实战解析

用周立功CAN分析仪抓包解析电动汽车充电握手（附真实报文数据）

从原理到代码：手把手教你用C语言和OpenSSL实现RSA分段加密与验签（附完整项目）

ABR 会将自身所在区域内的路由（包括直连网段）通过 Type 3 LSA 通告到其他区域，但不会通告回本区域

Multi-Agent产品策略：从功能堆砌到智能工作流的重构

MT7916芯片深度解析：从拆机中兴E1630看MTK首款AX3000方案

Zotero-OCR插件：3步实现PDF文献智能识别与可搜索文本层添加

【雷达成像】基于二维ADMM的稀度驱动ISAR成像附Matlab复现含文献

X.509数字证书实战解析：从结构到应用

别再只读SOC了！MAX17048电量计的高级玩法：休眠管理、报警阈值设置与电量跳变修复

MATLAB条形图进阶：从基础bar函数到数据可视化实战

RobotStudio导入外部工具模型避坑指南：从‘无坐标’模型到可用的工具坐标系

Databricks 自定义容器配置指南

从PID调参到根轨迹：一个电机控制工程师的实战避坑笔记

STM32 HAL库SPI驱动ST7789中景园屏实战：从CubeMX配置到显示优化

d2s-editor：暗黑破坏神2存档编辑实战指南与深度解析

信息学奥赛一本通 1248：Dungeon Master | 三维迷宫搜索算法精讲

别再手动算面积和距离了！用Shapely处理GeoJSON数据，效率提升10倍

基于西门子PLCS7-1200的程序仿真立体车库设计报告（含硬件原理图和CAD）

AI大模型对内容创作的颠覆：机遇、版权争议与行业新规则

MIPI-DSI协议解析：从物理层到应用层的LCD驱动实践

深度学习---注意力机制（Attention Mechanism）

别再复制粘贴了！手把手教你用原生Canvas实现一个会呼吸的六边形能力图（附完整源码）

移动零题解

神经网络参数初始化：从梯度失控到模型收敛的核心密码

【红队利器】Ehole实战指南：从指纹识别到精准打击

如何完整解锁ComfyUI-Impact-Pack V8版的所有图像增强功能

从源码到实战：手把手教你编译与定制化iperf网络性能测试工具