当前位置: 首页 > news >正文

从Remy到3D空间影像壁纸,鸿蒙3DGS的差异性体验,凭什么得到消费者的认可?

在香港酒店的河边跑步了10km,已经很晚,思绪很多,但想提笔写点什么。

最近鸿蒙6.1推出了3D空间影像壁纸,在小红书和抖音上非常火爆,消费者很喜欢,尤其是PuraX Max展开手机的一瞬间,那种视觉冲击力会让人爱不释手,老婆也因此从华为X5折叠换成了PuraX Max折叠:


而去年鸿蒙6.0推出了Remy,至今已经下载量超过200万:

从去年至今,有很多声音在讲:3DGS拍摄并不容易,容易阻碍其持续用户增长。我想这种担心不无道理,最重要的一个核心困境就是:难生产、无二次消费。

而3D空间影像壁纸的推出,似乎改变了这个局面。好比楼市的买方和卖方:当有更多消费者希望购买的时候,生产和交易自然会逐渐跟上。从根本上讲,是一种商业的变现已经出现了,从Remy的生产到手机壁纸的消费。

而我们为什么相信这件事情一定会发生?

背后是3DGS技术经过了2年多的快速演进,已经进入到了一个快速发展期,它不在是一个新的图形表达,类似Mesh、Voxel、Point等,而是在AI的大环境下,一种可以快速建模、生成、渲染,可微分的形成快速闭环链路的表达。举两个例子:

  1. 苹果的Live Photo和Sharp

不知道大家有没有关注到,在苹果的iOS上是如何体现空间体验的?第一步是Live Photo,你突然发现居然可以从一张静态图动了起来,但基本上可以理解为是一个小的video。
直到2025年底,Sharp的推出可以让一张照片形成Spatial Scene的体验,带有一定的生成:

论文核心就是这种图:

不谈这个模型的Encoder部分和Depth的估计,就看它的Decoder部分,接入的是3DGS,生成内容是3DGS。
为什么不是Mesh?当然Mesh也是可以的,但是Mesh不可微、推理自然不是这种表达的长处。而Mesh本身的三角面片表达,让锯齿效应显著,且从2D升维到3D的过程中,最需要的恰恰是3DGS这种带有半透效果的椭球表达最适合的。

  1. 李飞飞的Marble和Spark2.0
    自从发布过ImageNet之后,我们鲜有机会看到李飞飞的大颗粒度进展,直到Marble。

Marble的出现让大家听到了一个新的词,叫做“空间智能”。很抽象是吗?其实一点都不抽象,当你看到Marble的背后是单图生3DGS内容,然后在一个空间中结合对物体、人物的理解,产生今后的智能操作与交互。

但这个故事并没有讲完,Spark 2.0如期而至,它利用Marble的结果,通过动态LOD、流式加载等技术手段,让这种生成的3DGS内容,可以进入到端侧,进入到寻常百姓家。

我们讲了这么多,还是回到鸿蒙上。就像标题里提到的问题,3DGS到底凭什么进入到消费者的手机中?

让我们看看整个视觉体验的演进:
第一阶段:图片或图生图,图片是起点,是具有二维的像素体验。是人们接受这个世界的最初级的视觉方式

第二阶段:视频或图/文生视频,加了一个时间维度,让内容进入到了人脑,有了故事性,它可以让人们产生更多思考

第三阶段:3D或者图/文生3D,真正的三维空间,过去可以是Mesh、Voxel、点云等。用户感受的最佳的就是这个3D世界。

但是,无论是Mesh、Voxel和点云的时代,不要忘了,大部分的内容都是程序员/美术给你定义好的,就像游戏,程序和美术都给你写好了,每个人体验的几乎一样,都会有玩腻的时候。而且,游戏或者定义好的程序,你会发现它是虚拟的世界,并不是我们身边真实的3D世界。

而三维重建,从一定意义上改变了这一切。三维重建对真实世界是一种恢复,是有记忆属性的,是可以链接情感的,是能够产生增值属性的。

而无论是基于3DGS的Remy,还是基于3DGS的空间影像壁纸,带给人的恰恰是这份真实、交互和情感连接。它不仅具备所有三维表达的优势,而且它的真实和情感连接就是加分项,就是消费者喜爱的本质。

很多人都在问,3DGS之后的发展是什么?然后呢?我想不着急回答这个问题,先回答几个经常被问到的问题:

1. 3DGS的重建这么难,能不能产生内容简单点?

一定能,而且苹果的Sharp已经给了所有答案。我们的手机里有无数的图片,那么这种深度的估计和3DGS的生成就可以帮助我们通过单图理解或者几张稀疏图就可以还原,只不过你能“动”的空间受点限制而已

2. 3D影像壁纸的预置资源能不能多点?

一定能,因为真的不用只依赖于重建,生成不香吗?看看Marble,是不是单张图片的3DGS生成。

3. 3DGS大场景重建会出现在手机侧吗?

一定会,Spark 2.0已经给出了答案。想一想早期的图形Mesh表达,也是从一个手的Mesh三角抛分开始的,而现在一个模型动不动就是几百万Mesh

4. 3DGS生态上怎么样?能接入吗?

一定会,看看glTF标准是怎么把Mesh带起来的。很巧合,正好今天UWA发布了新的“三维图像格式”标准:
https://www.theuwa.com/upload/ueditor/file/20260528/1779953255373819/6458f53869ed5aced651cd891ffb11e1.pdf

写在最后,当你发现3DGS的理解、建模、生成、渲染叠加上标准都已经存在了,我们是不是更有理由相信:鸿蒙的3DGS差异化路径,会持续带给消费者喜爱的三维世界体验。它还有无限可能,现在只是开了一个头而已。

http://www.jsqmd.com/news/918490/

相关文章:

  • Windows Defender彻底移除终极指南:2025免费工具完整教程
  • 那些年,我追Google Trends追到精疲力尽的故事
  • YOLOv11地铁站台与候车室行李目标检测数据集-153张-suitcase-1_6
  • 「斯隆奖」得主戴亮全职加盟复旦
  • 2026年郑州企业AI获客难?盘点5家GEO优化服务商特点 - 资讯快报
  • 多塔柱混凝土矮塔斜拉桥结构解析方案【附数据】
  • Transformer架构深度解析:从原理到实践的全面指南
  • AI工具学习不是学软件,而是重构工作流:1套可迁移能力框架+5类岗位适配方案
  • 【多模态评测】图生文/文生图模型怎么测?多模态评测集 CLIP Score 介绍
  • 188、运动控制中的行业应用:电子装配与贴片机
  • 口袋神器!Arduino 创客必备,可接入 DeepSeek、Qwen 等 AI 大模型,通过 GPIO 串口控制 IoT 智能设备
  • 深入FIO引擎:除了libaio,这些ioengine(如sync, psync, mmap)在Linux下到底怎么选?性能差多少?
  • 终极键盘连击修复指南:Keyboard Chatter Blocker 专业防抖工具完全教程
  • NoFences:免费开源的Windows桌面分区神器终极指南
  • C++之父开撕AI Coding:资深开发者宁愿退休也不愿伺候AI生成的代码
  • C# 泛型
  • Rusted PackFile Manager:全面战争MOD开发的终极效率工具完整教程
  • 为什么你的论文参考文献格式总是不对?3个GB/T 7714 BibTeX样式终极解决方案
  • IF=10.0!浙大博士一作再登柳叶刀子刊!
  • 如何快速修改暗黑破坏神2存档:5分钟掌握d2s-editor完整使用指南
  • 2026年徐州甲级写字楼集中区揭秘,锁定这三大板块
  • Linux权限进阶:从passwd命令到SUID/SGID,搞懂那些‘s’和‘t’到底怎么用
  • 187、运动控制中的行业应用:机械臂力控打磨
  • 如何告别图片格式烦恼?Save Image as Type让网页图片一键转换
  • 前端内存泄漏常见场景与排查
  • FanControl深度解析:Windows风扇控制从入门到精通的完整指南
  • Gemini产品需求文档标准模板(2024最新版V2.3·仅限头部AI团队内部流通)
  • Python 潮流周刊#152:编程智能体终于跨过质量门槛了?
  • GTA5线上小助手:免费开源工具帮你轻松称霸洛圣都终极指南
  • 【AI+房地产实战指南】:2024年最值得落地的7大智能整合场景与避坑清单