当前位置: 首页 > news >正文

三维重建技术的最新进展

随着深度学习技术席卷计算机视觉领域,传统的基于图像几何关系的sfm和SLAM技术面临新的挑战,一方面基于深度学习的技术提供了新的视角影响计算机视觉的发展,另一方面深度学习的方法通常需要巨大的计算量限制了它的实用化,不管怎么样这些新技术都有很高的研究价值,虽然现在还不大可能在工程项目中直接使用这些技术,但随着手机,车载系统,ROS硬件水平的提高,这些新技术也许能找到用武之地。下面分类介绍一些这样的新技术。

NeRF:Representing Scenes as Neural Radiance Fields for View Synthesis
简介:深度学习与三维重建技术结合的开山之作,诞生了无数基于此技术的研究创新论文,随便在网上搜索一下就能搜出一大堆来,该方法通过使用multilayer perceptron (MLP),把三维场景用一个体函数表示,渲染的时候,根据视角位置和方向,生成体像素,最后用体渲染的方式显示出新位置的视觉效果。
代码:https://github.com/bmild/nerf

3D Gaussian Splatting for Real-Time Radiance Field Rendering
简介:短时间内迅速火爆三维重建领域,用3D高斯球点云描述三维场景,然后用分块光栅化进行渲染,论文的突破点在于实现快速的训练和渲染效果。话说在一块价格几万块的A6000GPU上跑100fps有点夸张。
代码:https://github.com/graphdeco-inria/gaussian-splatting

3D Gaussian Ray Tracing: Fast Tracing of Particle Scenes
3DGUT: Enabling Distorted Cameras and Secondary Rays in Gaussian Splatting
简介:Nvidia对于3DGS的扩展,使用raytracing进行渲染。总之都是效果奇好,速度奇慢,给显卡做广告到是不错。
代码:https://github.com/nv-tlabs/3dgrut

MASt3R-SLAM: Real-Time Dense SLAM with 3D Reconstruction Priors
简介:先由两张图片生成pointmap,然后再与当前关键帧做匹配,跟踪估计位姿并做pointmap融合,如果有新的关键帧则做回环检测和优化。应该算是比较完整的稠密SLAM方案。不依赖相机的类型约束也是一大亮点,相机可以做镜头缩放而不影响跟踪效果。
代码:https://github.com/rmurai0610/MASt3R-SLAM

LODGE:Level-of-Detail Large-Scale Gaussian Splatting with Efficient Rendering
简介:Google对3DGS的扩展,对场景使用LOD减少内存占用和加快渲染速度。在iphone 13 mini上能跑41fps,感觉性能还可以,推荐看一下。
代码:https://lodge-gs.github.io

MVSAnywhere: Zero-Shot Multi-View Stereo
简介:基于transformer架构的多视角深度估计算法。看论文介绍,该技术可以同时对室内外场景进行深度估计,看网站视频,对于室外大场景的深度估计还是很震撼的,推荐一下。
代码:https://nianticlabs.github.io/mvsanywhere/

MapAnything: Universal Feed-Forward Metric 3D Reconstruction
简介:基于transformer的架构把许多不同输入的图片和相机配置,一步直接生成三维场景,相当神奇。
代码:https://github.com/facebookresearch/map-anything

http://www.jsqmd.com/news/156267/

相关文章:

  • 基于Python的个性化电影推荐可视化系统的设计与实现爬虫可视化
  • 基于Python的招聘求职网站信息爬虫 可视化
  • Matlab代码:基于共享储能电站的工业用户日前优化经济调度 关键词:优化调度 共享储能 日前...
  • 2025.11.12上机实验四:SMO 算法实现与测试
  • PyTorch模型导出ONNX格式并在其他平台部署指南
  • 如何使用docker离线包?从此告别头疼的docker pull
  • 在 KubeSphere 上部署 AI 大模型 Ollama
  • Android开发工程师面试指南:基于IDAF职位要求的全面解析
  • 基于Python的摄影师婚纱租赁 预约与交易系统vue
  • Conda环境导出为yml文件,便于团队共享PyTorch配置
  • 2025.11.8上机实验二:逻辑回归算法实现与测试
  • YOLOv11训练日志解读:loss下降趋势正常吗?
  • 编译原理中**语法制导翻译**(Syntax-Directed Translation, SDT)在中间代码生成阶段的核心机制
  • PyTorch模型量化压缩指南,降低推理所需Token数
  • openEuler集群 Chrony 时间同步实战:从零构建高精度分布式时钟体系
  • Jupyter Notebook单元格执行顺序陷阱及避免方法
  • 基于Python的新能源汽车美容洗车预约系统vue
  • 027.归并排序
  • 2025.11.10上机实验三:C4.5(带有预剪枝和后剪枝)算法实现与测试
  • 中信银行信用卡中心Android高级研发工程师岗位深度解析与技术面试指南
  • 上位机是什么意思:工业4.0中OPC UA协议的应用
  • 2025.10.30非遗声景漫游馆(项目架构文档)
  • 清华大学开源镜像站配置PyTorch源的方法详解
  • 2025最新!8款AI论文软件测评:本科生毕业论文写作全攻略
  • SHEIN高级/资深iOS研发工程师:技术深度解析与面试指南
  • SSH免密登录PyTorch服务器,提高开发效率
  • AI原生应用领域下的AI工作流最佳实践
  • 2025.11.3社区智慧共享资源管理系统(项目概述文档)
  • 2025.10.31非遗声景漫游馆(技术实现文档)
  • 文法定义了一个典型的表达式文法,支持加法和乘法,具有左递归以实现左结合