当前位置：首页 > news >正文

LIO-SAM 优化方向综述：从因子图到多模态SLAM

news 2026/7/25 23:05:38

前言

LIO-SAM 在 2020 年通过因子图 + iSAM2 增量优化的组合，在激光SLAM领域树立了"紧耦合多传感器融合"的标杆。但其设计也存在优化空间：GTSAM 依赖导致安装门槛高、回环检测依赖 ICP 精度、未融合视觉信息。本文梳理 LIO-SAM 系列及竞品的发展脉络。

1. LIO-SAM 系列演进全景

LeGO-LOAM (Shan, 2018) │ 核心：地面分割 + 轻量级 + 回环检测 │ 局限：无 IMU，纯激光，精度受限 │ ├── LIO-SAM (Shan, 2020) │ 改进：IMU 预积分 + GPS + 因子图优化 │ 影响：自动驾驶SLAM标配 │ ├── LIO-SAM-ROS2 (社区, 2023) │ 改进：ROS2 Humble 移植 │ ├── LVI-SAM (Shan, 2021) │ 改进：视觉-激光-惯性全融合 │ 核心：两个子系统互补（VIS 视觉 + LIS 激光） │ ├── R3LIVE (Lin, 2022) │ 改进：实时彩色3D重建 + 激光-视觉-惯性融合 │ ├── FAST-LIO-SAM (社区融合, 2023) │ 改进：Fast-LIO2 前端 + LIO-SAM 后端 │ └── LVIO-SAM (最新, 2024) 改进：统一视觉-激光-惯性因子图 + 深度学习描述子

2. 方向一：视觉-激光-惯性融合 (LVI-SAM)

2.1 为什么需要视觉

激光雷达的退化场景： 相机能补充： ├── 长走廊（几何退化） ├── 丰富的纹理特征 ├── 开阔空间（结构单一） ├── 视觉回环更鲁棒 └── 雨天/雾天（衰减严重） └── 语义信息 相机的退化场景： 激光雷达能补充： ├── 暗光/过曝 ├── 主动发光，全天候 ├── 无纹理白墙 ├── 精确3D几何 └── 快速运动（模糊） └── 运动模糊不敏感

2.2 LVI-SAM 的双子系统架构

┌──────────────────────────────────────────────────┐ │ LVI-SAM │ │ │ │ ┌─────────────────┐ ┌─────────────────┐ │ │ │ VIS 视觉子系统 │ │ LIS 激光子系统 │ │ │ │ (基于VINS-Mono) │ │ (基于LIO-SAM) │ │ │ └────────┬────────┘ └────────┬────────┘ │ │ │ │ │ │ └──────────┬──────────┘ │ │ ▼ │ │ ┌─────────────────┐ │ │ │ 联合初始化 │ │ │ │ (视觉深度→激光) │ │ │ └─────────────────┘ │ │ │ │ │ ▼ │ │ ┌─────────────────┐ │ │ │ 互补失败检测 │ │ │ │ 任一子系统失败 │ │ │ │ → 另一系统继续 │ │ │ └─────────────────┘ │ └──────────────────────────────────────────────────┘

LVI-SAM 的核心创新：

VIS 失败时（暗光/运动模糊）→ LIS 继续提供位姿
LIS 失败时（几何退化）→ VIS 继续提供位姿
视觉深度初始化由激光提供（不需要视觉SFM）
联合回环检测（视觉 + 激光双重验证）

3. 方向二：高效前端替代 (FAST-LIO-SAM)

3.1 问题

LIO-SAM 的 LiDAR 前端（特征提取 + KD-Tree 匹配）计算量较大（~30ms），拖累了整体效率。

3.2 FAST-LIO-SAM（社区融合方案）

传统 LIO-SAM: A-LOAM 式前端 (特征 + KD-Tree + Ceres优化, ~30ms) │ ▼ LIO-SAM 后端 (因子图 + 回环, ~15ms) 总耗时 ~45ms FAST-LIO-SAM: Fast-LIO2 前端 (IESKF + ikd-Tree, ~3ms) │ ▼ LIO-SAM 后端 (因子图 + 回环, ~15ms) 总耗时 ~18ms → 速度提升 2.5× 且精度更高（IMU 紧耦合前端比松耦合前端鲁棒）

4. 方向三：彩色3D重建 (R3LIVE)

4.1 R3LIVE 的创新

R3LIVE 将彩色相机信息融入 LIO 框架，实时生成带有颜色信息的3D点云地图：

R3LIVE 架构: 激光点云 + IMU + 相机图像 │ ▼ ┌────────────────┐ │ IESKF 状态估计 │ ← 同 Fast-LIO2 的 IESKF │ (激光+惯性) │ └───────┬────────┘ │ ▼ ┌────────────────┐ │ 点云纹理着色 │ │ - 将激光点投影到 │ │ 相机图像上 │ │ - 双线性插值取色 │ │ - 更新体素颜色 │ └───────┬────────┘ │ ▼ 实时彩色 3D 点云地图

4.2 与 LIO-SAM 的对比

特性	LIO-SAM	R3LIVE
传感器	LiDAR+IMU+GPS	LiDAR+IMU+Camera
输出地图	激光点云（白色）	彩色激光点云
优化方式	GTSAM 因子图	IESKF 滤波
回环检测	有	无
GPS	支持	不支持
视觉融合	无	有（纹理着色）

5. 方向四：回环检测增强

5.1 LIO-SAM 回环检测的局限

LIO-SAM 使用欧氏距离 + ICP回环检测，存在两个问题：

视角变化敏感：从不同方向回到同一地点时，ICP 可能无法收敛
计算效率低：ICP 迭代 100 次，在大地图中成为瓶颈

5.2 Scan Context 改进

LIO-SAM + Scan Context: 1. 关键帧 → 计算 Scan Context 描述子（2D矩阵） 2. 在历史描述子数据库中搜索最相似 3. 用列偏移（rotation-invariant）找到最佳匹配 4. 候选帧 + ICP 验证 → 回环因子

5.3 深度学习回环检测

方法	描述子类型	对视角变化的鲁棒性
Scan Context	手工（高度分布）	中
Intensity Scan Context	手工（+反射率）	中高
OverlapNet	学习（CNN）	高
LCDNet	学习（Transformer）	极高

6. 方向五：多机器人协同

6.1 问题

单机器人 LIO-SAM 只能构建局部地图。多机器人协同SLAM可以构建更大的地图。

6.2 方案

机器人A: LIO-SAM 建图 机器人B: LIO-SAM 建图 │ │ ▼ ▼ 局部因子图A 局部因子图B │ │ └───────────┬───────────────────┘ │ ▼ ┌─────────────────────┐ │ 机器人间回环检测 │ │ (共同区域的重叠检测) │ └──────────┬──────────┘ │ ▼ ┌─────────────────────┐ │ 联合因子图优化 │ │ 全局一致性地图 │ └─────────────────────┘

代表工作：DiSCo-SLAM（分布式激光SLAM协同）、DCL-SLAM

7. 方向六：动态环境处理

7.1 动态物体的影响

自动驾驶场景中的行人、车辆等动态物体会在激光点云中产生"鬼影"——错误的地图点和错误的匹配对应。

7.2 处理方案

方案	方法	对LIO-SAM的改动
语义剔除	RangeNet++ 逐点分割 → 剔除"人""车"标签	前端预处理
一致性检查	匹配后残差分布分析 → 剔除大残差点	残差级改动
地图减法	当前帧 - 历史地图 → 动态区域 → 移除地图点	后端改动
跟踪预测	Kalman 跟踪动态物体 → 预测位置 → 避免匹配	匹配阶段改动

8. 方向七：深度学习增强

8.1 IMU 降噪

用 LSTM/Transformer 网络学习 IMU 噪声模式，输出去噪后的 IMU 测量 → 提升预积分精度。

8.2 自适应噪声协方差

用网络预测当前帧的 LiDAR 匹配质量 → 动态调整因子图中的ΣLiDAR\Sigma_{LiDAR}ΣLiDAR。

8.3 特征学习

用 PointNet++ 替代手工曲率特征 → 更鲁棒的特征提取，特别是在稀疏/噪声点云中。

8.4 端到端因子图

输入：IMU 序列 + 激光点云序列 │ ▼ 神经网络编码器 │ ▼ 输出：因子图（节点 + 因子） │ ▼ 传统 GTSAM iSAM2 求解

9. 各系统特色速查

系统	年份	传感器	回环	视觉	GPS	特点
LeGO-LOAM	2018	LiDAR	✓	✗	✗	地面分割 + 轻量
LIO-SAM	2020	LiDAR+IMU+GPS	✓	✗	✓	因子图紧耦合
LVI-SAM	2021	LiDAR+视觉+IMU	✓	✓	✗	激光视觉互补
R3LIVE	2022	LiDAR+视觉+IMU	✗	✓	✗	实时彩色重建
FAST-LIO2	2021	LiDAR+IMU	✗	✗	✗	极致速度
FAST-LIO-SAM	2023	LiDAR+IMU	✓	✗	✗	Fast-LIO前端 + SAM后端
FAST-LIVO2	2024	LiDAR+视觉+IMU	✗	✓	✗	多模态紧耦合