当前位置: 首页 > news >正文

LIO-SAM 优化方向综述:从因子图到多模态SLAM

前言

LIO-SAM 在 2020 年通过因子图 + iSAM2 增量优化的组合,在激光SLAM领域树立了"紧耦合多传感器融合"的标杆。但其设计也存在优化空间:GTSAM 依赖导致安装门槛高、回环检测依赖 ICP 精度、未融合视觉信息。本文梳理 LIO-SAM 系列及竞品的发展脉络。


1. LIO-SAM 系列演进全景

LeGO-LOAM (Shan, 2018) │ 核心:地面分割 + 轻量级 + 回环检测 │ 局限:无 IMU,纯激光,精度受限 │ ├── LIO-SAM (Shan, 2020) │ 改进:IMU 预积分 + GPS + 因子图优化 │ 影响:自动驾驶SLAM标配 │ ├── LIO-SAM-ROS2 (社区, 2023) │ 改进:ROS2 Humble 移植 │ ├── LVI-SAM (Shan, 2021) │ 改进:视觉-激光-惯性全融合 │ 核心:两个子系统互补(VIS 视觉 + LIS 激光) │ ├── R3LIVE (Lin, 2022) │ 改进:实时彩色3D重建 + 激光-视觉-惯性融合 │ ├── FAST-LIO-SAM (社区融合, 2023) │ 改进:Fast-LIO2 前端 + LIO-SAM 后端 │ └── LVIO-SAM (最新, 2024) 改进:统一视觉-激光-惯性因子图 + 深度学习描述子

2. 方向一:视觉-激光-惯性融合 (LVI-SAM)

2.1 为什么需要视觉

激光雷达的退化场景: 相机能补充: ├── 长走廊(几何退化) ├── 丰富的纹理特征 ├── 开阔空间(结构单一) ├── 视觉回环更鲁棒 └── 雨天/雾天(衰减严重) └── 语义信息 相机的退化场景: 激光雷达能补充: ├── 暗光/过曝 ├── 主动发光,全天候 ├── 无纹理白墙 ├── 精确3D几何 └── 快速运动(模糊) └── 运动模糊不敏感

2.2 LVI-SAM 的双子系统架构

┌──────────────────────────────────────────────────┐ │ LVI-SAM │ │ │ │ ┌─────────────────┐ ┌─────────────────┐ │ │ │ VIS 视觉子系统 │ │ LIS 激光子系统 │ │ │ │ (基于VINS-Mono) │ │ (基于LIO-SAM) │ │ │ └────────┬────────┘ └────────┬────────┘ │ │ │ │ │ │ └──────────┬──────────┘ │ │ ▼ │ │ ┌─────────────────┐ │ │ │ 联合初始化 │ │ │ │ (视觉深度→激光) │ │ │ └─────────────────┘ │ │ │ │ │ ▼ │ │ ┌─────────────────┐ │ │ │ 互补失败检测 │ │ │ │ 任一子系统失败 │ │ │ │ → 另一系统继续 │ │ │ └─────────────────┘ │ └──────────────────────────────────────────────────┘

LVI-SAM 的核心创新:

  • VIS 失败时(暗光/运动模糊)→ LIS 继续提供位姿
  • LIS 失败时(几何退化)→ VIS 继续提供位姿
  • 视觉深度初始化由激光提供(不需要视觉SFM)
  • 联合回环检测(视觉 + 激光双重验证)

3. 方向二:高效前端替代 (FAST-LIO-SAM)

3.1 问题

LIO-SAM 的 LiDAR 前端(特征提取 + KD-Tree 匹配)计算量较大(~30ms),拖累了整体效率。

3.2 FAST-LIO-SAM(社区融合方案)

传统 LIO-SAM: A-LOAM 式前端 (特征 + KD-Tree + Ceres优化, ~30ms) │ ▼ LIO-SAM 后端 (因子图 + 回环, ~15ms) 总耗时 ~45ms FAST-LIO-SAM: Fast-LIO2 前端 (IESKF + ikd-Tree, ~3ms) │ ▼ LIO-SAM 后端 (因子图 + 回环, ~15ms) 总耗时 ~18ms → 速度提升 2.5× 且精度更高(IMU 紧耦合前端比松耦合前端鲁棒)

4. 方向三:彩色3D重建 (R3LIVE)

4.1 R3LIVE 的创新

R3LIVE 将彩色相机信息融入 LIO 框架,实时生成带有颜色信息的3D点云地图

R3LIVE 架构: 激光点云 + IMU + 相机图像 │ ▼ ┌────────────────┐ │ IESKF 状态估计 │ ← 同 Fast-LIO2 的 IESKF │ (激光+惯性) │ └───────┬────────┘ │ ▼ ┌────────────────┐ │ 点云纹理着色 │ │ - 将激光点投影到 │ │ 相机图像上 │ │ - 双线性插值取色 │ │ - 更新体素颜色 │ └───────┬────────┘ │ ▼ 实时彩色 3D 点云地图

4.2 与 LIO-SAM 的对比

特性LIO-SAMR3LIVE
传感器LiDAR+IMU+GPSLiDAR+IMU+Camera
输出地图激光点云(白色)彩色激光点云
优化方式GTSAM 因子图IESKF 滤波
回环检测
GPS支持不支持
视觉融合有(纹理着色)

5. 方向四:回环检测增强

5.1 LIO-SAM 回环检测的局限

LIO-SAM 使用欧氏距离 + ICP回环检测,存在两个问题:

  1. 视角变化敏感:从不同方向回到同一地点时,ICP 可能无法收敛
  2. 计算效率低:ICP 迭代 100 次,在大地图中成为瓶颈

5.2 Scan Context 改进

LIO-SAM + Scan Context: 1. 关键帧 → 计算 Scan Context 描述子(2D矩阵) 2. 在历史描述子数据库中搜索最相似 3. 用列偏移(rotation-invariant)找到最佳匹配 4. 候选帧 + ICP 验证 → 回环因子

5.3 深度学习回环检测

方法描述子类型对视角变化的鲁棒性
Scan Context手工(高度分布)
Intensity Scan Context手工(+反射率)中高
OverlapNet学习(CNN)
LCDNet学习(Transformer)极高

6. 方向五:多机器人协同

6.1 问题

单机器人 LIO-SAM 只能构建局部地图。多机器人协同SLAM可以构建更大的地图。

6.2 方案

机器人A: LIO-SAM 建图 机器人B: LIO-SAM 建图 │ │ ▼ ▼ 局部因子图A 局部因子图B │ │ └───────────┬───────────────────┘ │ ▼ ┌─────────────────────┐ │ 机器人间回环检测 │ │ (共同区域的重叠检测) │ └──────────┬──────────┘ │ ▼ ┌─────────────────────┐ │ 联合因子图优化 │ │ 全局一致性地图 │ └─────────────────────┘

代表工作:DiSCo-SLAM(分布式激光SLAM协同)、DCL-SLAM


7. 方向六:动态环境处理

7.1 动态物体的影响

自动驾驶场景中的行人、车辆等动态物体会在激光点云中产生"鬼影"——错误的地图点和错误的匹配对应。

7.2 处理方案

方案方法对LIO-SAM的改动
语义剔除RangeNet++ 逐点分割 → 剔除"人""车"标签前端预处理
一致性检查匹配后残差分布分析 → 剔除大残差点残差级改动
地图减法当前帧 - 历史地图 → 动态区域 → 移除地图点后端改动
跟踪预测Kalman 跟踪动态物体 → 预测位置 → 避免匹配匹配阶段改动

8. 方向七:深度学习增强

8.1 IMU 降噪

用 LSTM/Transformer 网络学习 IMU 噪声模式,输出去噪后的 IMU 测量 → 提升预积分精度。

8.2 自适应噪声协方差

用网络预测当前帧的 LiDAR 匹配质量 → 动态调整因子图中的ΣLiDAR\Sigma_{LiDAR}ΣLiDAR

8.3 特征学习

用 PointNet++ 替代手工曲率特征 → 更鲁棒的特征提取,特别是在稀疏/噪声点云中。

8.4 端到端因子图

输入:IMU 序列 + 激光点云序列 │ ▼ 神经网络编码器 │ ▼ 输出:因子图(节点 + 因子) │ ▼ 传统 GTSAM iSAM2 求解

9. 各系统特色速查

系统年份传感器回环视觉GPS特点
LeGO-LOAM2018LiDAR地面分割 + 轻量
LIO-SAM2020LiDAR+IMU+GPS因子图紧耦合
LVI-SAM2021LiDAR+视觉+IMU激光视觉互补
R3LIVE2022LiDAR+视觉+IMU实时彩色重建
FAST-LIO22021LiDAR+IMU极致速度
FAST-LIO-SAM2023LiDAR+IMUFast-LIO前端 + SAM后端
FAST-LIVO22024LiDAR+视觉+IMU多模态紧耦合

10. 总结

LIO-SAM 系列的优化方向可以概括为"三融合":

  1. 传感器融合 (激光+视觉+惯性):从单激光到 LIO-SAM,再到 LVI-SAM/FAST-LIVO2,异构传感器互补
  2. 方法融合(优化+滤波):FAST-LIO-SAM 结合了滤波的效率(前端)和优化的全局性(后端)
  3. 智能融合(传统+学习):深度学习逐步渗透到特征提取、噪声建模、回环检测等模块

未来的激光SLAM将走向全模态、全场景、零延迟的方向,R3LIVE 和 FAST-LIVO2 已经展示了这条路径的可行性。

http://www.jsqmd.com/news/913451/

相关文章:

  • 模型幻觉频发、收敛极慢、资源耗尽——Claude优化问题全链路诊断,今天必须修复的4个致命配置
  • 用 AI 写自媒体文案,再也不用熬夜
  • 业主做门窗定制,到底在定制什么?从安全、舒适到交付的真实需求分析
  • DOM ProcessingInst: 深入解析与高效实践
  • 选装修公司别瞎跑,靠谱张工教你几招辨好坏
  • vue3 + ts reactive方式清空表单对象
  • Unity里用WebView插件播放WebRTC视频流,我踩过的坑和完整配置流程
  • 微信如何群发文件与PDF?2026合规批量分发完整解决方案
  • Uni-Dock批量对接实战:从SMILES到结果分析,一条龙避坑指南(附完整Python脚本)
  • 从“增程之王”到“纯电标杆”,理想汽车击碎偏见
  • Claude头脑风暴辅助实战手册(企业级思维加速器):覆盖创意发散、逻辑收敛、方案落地全链路
  • LSD-SLAM 完整安装教程(Ubuntu 20.04 + ROS Noetic + OpenCV)
  • 网络工程- 如何组件一个小型办公室网络
  • macOS微信防撤回终极指南:3分钟搞定WeChatIntercept完整安装教程
  • 如何用WeChatMsg打造个人专属的微信聊天记录档案馆
  • Wechatsync CSDN 草稿同步源码分析:为什么当前只能保存草稿,不能自动公开发布
  • 开福区标书制作哪家靠谱
  • MongoDB事务处理实战
  • 别再死记硬背了!用这3个方法,让你的Mac快捷键记忆效率翻倍(附实用工具推荐)
  • AI智能日志异常检测告警平台:告别人工排查,秒级定位线上故障
  • 打破Windows与Linux数据壁垒:5分钟掌握NTFS-3G跨平台文件互通
  • Claude情感响应失真诊断手册(工业级情感熵值测算首次公开)
  • 在HermesAgent项目中自定义Provider接入Taotoken多模型服务
  • 2026最新华为OD机试新系统 机考真题考点分类 + 备考策略
  • 2026年AI服务统一入口横评,主流平台技术硬实力究竟谁领先?
  • 3分钟解锁极域电子教室控制:JiYuTrainer让课堂学习更自由
  • FreeRTOS 队列深度解析:队列的读写
  • 书匠策AI到底是个啥?一个论文科普博主的深度拆解,看完你会回来谢我
  • 01-倒排索引原理-搜索引擎为什么能秒搜
  • 【字节跳动】云南昆明高原恒温算力中枢 极致精细化逐条全拆解