Gaussian Splatting(高斯泼溅)技术原理与应用详解:下一代3D重建技术来了
Gaussian Splatting(高斯泼溅)技术原理与应用详解:下一代3D重建技术来了
SEO关键词
Gaussian Splatting、高斯泼溅、高斯建模、3D重建技术、NeRF、神经辐射场、4D Gaussian Splatting、三维扫描、数字孪生、全息影像、摄影测量、虚幻引擎、实时渲染
大家好 这里是「代码简单说」,欢迎大家关注同名公众号,不定时更新更多实用有趣的教程 也欢迎大家在评论区一起讨论交流!~
如果我告诉你:
你看到的场景并不是真实存在的;
它不是CG建模;
也不是AI生成图片;
但你却可以自由移动视角,从任意角度观察它;
甚至还能暂停时间、穿越时间轴。
那么这种技术是什么?
答案就是最近几年火遍整个3D视觉领域的——Gaussian Splatting(高斯泼溅)。
很多人认为AI时代最大的突破是ChatGPT。
但在计算机图形学领域,高斯泼溅的出现,同样属于革命级别的技术突破。
它让照片级真实感三维重建第一次具备了:
- 实时渲染能力
- 超高画面质量
- 极低制作门槛
- 浏览器直接查看
甚至很多业内人士认为:
高斯泼溅可能会成为未来全息影像时代的基础格式。
今天这篇文章,就带大家系统了解这项技术。
一、什么是 Gaussian Splatting
在线体验地址
https://aholojs.dev/zh-CN/examples/walk-demo/
简单来说:
Gaussian Splatting 是一种基于辐射场(Radiance Field)的三维场景重建技术。
它能够通过大量照片或者视频素材,重建出一个可自由观察的三维世界。
效果类似这样:
- 房间扫描
- 景区扫描
- 古建筑数字化
- 人物扫描
- 商品展示
- VR场景
最终生成的结果不是传统3D模型,而是一种由大量高斯点构成的场景。
效果接近真实摄影。
甚至很多情况下比传统建模更加真实。
二、为什么 NeRF 没火,高斯泼溅却火了
在高斯泼溅出现之前。
最火的技术其实叫:
NeRF(Neural Radiance Field)
中文:
神经辐射场
当时NeRF被很多人认为是未来。
因为它第一次实现了:
- 照片级真实感
- 自动重建
- 无需人工建模
但NeRF有一个致命问题:
太慢
NeRF本质上是一个神经网络。
每次查看场景时都需要:
输入视角 ↓ 神经网络计算 ↓ 生成图像因此:
- 训练慢
- 渲染慢
- 编辑困难
很难真正应用到生产环境。
而Gaussian Splatting则完全不同。
它不是神经网络。
它是真实存在于三维空间中的数据结构。
因此:
- 渲染速度快
- 编辑方便
- 可以实时运行
这也是为什么高斯泼溅在短短一年时间内迅速取代NeRF。
三、高斯泼溅的工作原理
首先来看一个普通摄影测量流程。
第一步:拍摄大量照片
例如扫描一个苹果。
你需要:
- 左边拍
- 右边拍
- 上面拍
- 下面拍
尽可能覆盖所有角度。
第二步:SfM运动恢复结构
Structure from Motion
简称:
SfM作用:
计算每张照片拍摄的位置。
同时寻找不同照片中的对应特征点。
例如:
苹果表面某个斑点出现在多张图片中。
系统就能通过三角测量得到:
三维坐标最终形成:
点云 Point Cloud第三步:生成高斯点
传统摄影测量:
点云 ↓ 三角面 ↓ 网格模型 ↓ 贴图而高斯泼溅则是:
点云 ↓ 高斯分布 ↓ 训练优化 ↓ 最终场景不需要构建复杂网格。
四、高斯点到底是什么
高斯泼溅的核心就是:
Gaussian
即:
高斯分布
从远处看:
●像一个点。
实际上放大后:
◉是一个模糊的光斑。
每个高斯点都记录:
| 属性 | 作用 |
|---|---|
| 位置 | 三维坐标 |
| 旋转 | 朝向 |
| 尺寸 | 大小 |
| 形状 | 拉伸方向 |
| 透明度 | Alpha |
| 颜色 | 表面信息 |
一个场景中可能包含:
100万+ 500万+ 1000万+个高斯点。
这些点不断叠加。
最终形成真实场景。
就像画家不断往画布上泼洒颜料。
因此得名:
Gaussian Splatting高斯泼溅。
五、为什么高斯泼溅如此真实
关键原因:
视角依赖颜色
现实世界中的颜色并不是固定的。
例如苹果。
从不同角度看:
- 明亮区域不同
- 高光位置不同
- 反射强度不同
这就是:
View Dependent Color视角依赖颜色。
传统3D模型很难准确表达。
而Gaussian Splatting直接记录:
光线信息因此能够表现:
- 金属反射
- 玻璃反射
- 水面反射
- 光泽变化
效果极其真实。
六、球谐函数是什么
很多人第一次接触高斯泼溅都会看到一个词:
SH
Spherical Harmonics
中文:
球谐函数问题来了。
方向是无限的。
颜色变化也是无限的。
难道每个高斯点要存储无限种颜色?
当然不可能。
高斯泼溅采用:
基础颜色 + 球谐函数参数表示颜色变化。
公式会根据观察方向自动调整颜色。
类似:
最终颜色 = 基础颜色 + 方向修正值因此仅用少量数据。
就能表达大量视角变化。
这也是高斯泼溅体积小、效率高的重要原因。
七、高斯泼溅制作流程
实际制作一般分为三步。
1、数据采集
最关键。
拍摄原则:
快门速度要高
推荐:
1/500 1/1000避免运动模糊。
锁定曝光
避免:
- 自动曝光
- 自动白平衡
- 自动对焦
否则训练容易失败。
多角度覆盖
确保:
没有死角否则最终场景会出现空洞。
2、相机追踪
常见工具:
- COLMAP
- Reality Capture
- Reality Scan
- Metashape
作用:
计算相机位置。
生成稀疏点云。
3、训练高斯模型
常见工具:
- Postshot
- Luma AI
- Luma Field Studio
- Kiri Engine
- Polycam
训练完成后即可生成高斯场景。
八、高斯泼溅最强的应用场景
数字文物保护
古建筑扫描。
历史遗迹数字化。
即使未来建筑消失。
数字资产依然存在。
房地产展示
用户无需到现场。
即可自由浏览:
- 房屋
- 酒店
- 商场
效果远超传统全景图。
游戏资产制作
利用游戏截图:
截图 ↓ 高斯重建 ↓ 实时浏览快速生成场景资产。
影视制作
直接导入:
- Unreal Engine
- Unity
- Blender
用于:
- 虚拟制片
- LED大屏拍摄
- VFX特效
VR与MR
Meta Quest
Apple Vision Pro
都已经开始支持相关技术。
未来极有可能成为:
空间互联网的重要组成部分。
九、4D Gaussian Splatting是什么
如果说3D高斯泼溅记录的是:
X Y Z空间信息。
那么4D高斯泼溅增加了:
Time时间维度。
即:
X + Y + Z + T这样不仅能观察空间。
还能观察时间。
例如:
- 人物动作
- 跳跃
- 奔跑
- 表情变化
全部被记录下来。
最终效果类似科幻电影中的:
全息影像
你可以:
- 暂停
- 慢放
- 环绕观察
- 子弹时间
自由控制。
十、高斯泼溅的未来
目前来看。
高斯泼溅正在快速进入:
- Google地图
- 数字孪生
- 房地产
- 文旅景区
- VR平台
- 影视制作
等多个领域。
未来几年我们很可能看到:
图片时代 ↓ 视频时代 ↓ 全息时代的演进过程。
而高斯泼溅极有可能成为全息时代的重要文件格式之一。
总结
Gaussian Splatting之所以被称为近几年计算机图形学最重要的突破之一。
原因很简单:
它同时解决了:
- 真实感
- 实时性
- 制作成本
三个长期难以兼顾的问题。
相比NeRF:
- 更快
- 更轻量
- 更容易落地
相比传统建模:
- 更真实
- 更自动化
- 更适合现实世界数字化
如果说摄影定义了图片时代。
视频定义了短视频时代。
那么高斯泼溅正在定义下一代空间媒体时代。
也许未来的互联网不再是二维网页。
而是一整个可以自由穿梭的三维世界。
