当前位置: 首页 > news >正文

【转】谷歌新发布的世界模型 Genie 3 和 李飞飞的 Marble

我并不看好,因为这本质上只是一个 AI 生成的互动视频,不是游戏!

原文全文完整版链接: https://www.ccgxk.com/emlog_dev/640.html

概念上没有任何的突破!!!

连和 unity 和 虚幻引擎 里的物理计算部分,都没法比。缺少物理世界的摩擦,碰撞,和精细的空间计算。不要被忽悠了!

它就是类似豆包里的文字转视频、图片生视频。只不过速度快了点,记性好了点,还有键盘互动!

这条路不该这样走。

但是作为做梦视频生成器还是不错的。游戏绝对不能。

也就是说,它未来的应用领域是【拍电影】,而不是【游戏】。太费 token 了。而且稳定性和 AI 说话一样,极不稳定,很不可控。

为什么?因为 它必然存在【幻觉】!

这个大亮点是 Genie 3 能以 720p 分辨率和每秒 24 帧的好几分钟的 3D 交互世界,这个和视频没什么区别了!

去年的 Genie 2 就跟短视频一样,进去走两步,十几秒就到头了。

在官网上说,Genie 3 是能保持物理一致性,能记住之前的场景。

img

真的太有意思了!

然后 DeepMind 说,原理是模型会记住自己之前生成的内容,然后进行推理,根据过去的自学物理作用来获取下一帧。

为什么只有几分钟呢?这个还是瓶颈,就是因为它必须回溯曾经生成的内容。这个肯定会耗费大量的 token 。

1770041649028.webp

不过,由于 AI 只能靠大量资料去推理,它们的物理理解能力..... 还有待加强。

但确实质量超级棒!下面这个是 techcrunch 的记者生成的棉花糖世界!

img

不过很遗憾,我现在还没有找到路子去试用 Genie 系列的东西,也即是 Project Genie ,试用只能是供美国地区的AI Ultra 订阅者开放。

这个 Project Genie 是一个集合工具,可以根据文本生成一个世界!由 Genie 3 + Nano Banana Pro + Gemini 共同驱动。

其实吧,这个就是一个加强版的 文字生视频 吧!但现在的效果就已经很 6 了,希望有生之年能让我实现 24 小时沉浸在虚拟世界这个伟大的梦想。

看看隔壁:

我很看好的 李飞飞的 Marble ,这个是去年年底发布的世界模型,是基于物理实验室实现的。它的特点是 持久、可下载 !不是 Genie 这种实时生成,实时丢弃。

下面这个动图是 Marble 的宣传图片。

marble

我觉得 Genie 不靠谱。

如果你做过 AI 产品,就能发现,对话的最大问题是每次对话,都会把上下文全发过去,跟滚雪球一样。

即便未来 Genie 再逼真、快速、廉价,它终归是滚雪球的。要实现几天几年的持续性,那必然需要压损、损耗.....

而 李飞飞的 Marble 它生成的,是类似于 3D 模型或高斯点云,更像是一个真正的世界模型。

用 5 个字形容 marble 和 genie 的区别就是,marble 有 【创意掌控权】。

genie 就是机器完全接管了,跟做梦一样,你走了 5 年回到原地,发现原地早已经没了。而 marble 则还是原样!

当然,还有几个大厂在研究世界模型。

比如 Meta 的 AMI Labs (杨立昆负责) 。以及 Runway 公司的 Runway。

前者它不是一个真正的世界,而是梦境里的世界。后者才是一个可以和 unity 引擎、虚幻引擎、还有我私下里研究的 openworld-js 迷你三维世界引擎结合的可靠 AGI 。

前者或许不需要大量的储存空间,但需要极大的算力,后者..... 直接生成了巨大的世界,需要巨大的储存空间。

反正我也很矛盾,鱼和熊掌不可兼得....

两者未来,必然是两个选择。而不是竞争关系。

http://www.jsqmd.com/news/334899/

相关文章:

  • <span class=“js_title_inner“>Gartner:2026年数据分析和人工智能规划指南</span>
  • ipad github应用可以结合copilot 学习项目
  • 前端入门全攻略|零基础到精通,收藏这篇搞定所有
  • 《PHP 文件:深入理解与应用》
  • <span class=“js_title_inner“>第152篇:希水涵Web日志分析工具(ABC_123原创)| 识别攻击行为,生成可视化报告</span>
  • Scala 数据类型
  • SSM毕设项目推荐-基于ssm的种子商店网站的设计与开发种子销售渠道 种子展示、在线购买、【附源码+文档,调试定制服务】
  • 2026年只能靠这套100集Java面试题【八股+场景】逆袭互联网大厂了!程序员们有福了!再也不用担心被裁员了!
  • YOLO11-ASF-P2模型实现蚕桑业健康状态识别完整教程
  • 计算机大学生竞赛清单|护网 + CTF 从入门到参赛全攻略
  • 本科直接工作 VS 读研后再战?毕业后第一份工作如何选?
  • YOLOv26在水果图像识别与分类中的应用:苹果、猕猴桃、橙子和红毛丹的检测研究
  • SSM毕设选题推荐:基于ssm的种子商店网站的设计与开发种子展示、在线购买、订单管理与农技服务【附源码、mysql、文档、调试+代码讲解+全bao等】
  • P1120题解报告
  • 一文解析亚像素技术如何重塑机器视觉
  • 手工编曲拼不过AI编曲伴奏的速度,盘点原创音乐人私下使用的5款AI编曲软件
  • OpenAI Playground 是什么?
  • 【算法复现解读】ESPBO:多策略增强的学生心理优化算法附Matlab代码
  • <span class=“js_title_inner“>Spring AOP + Guava RateLimiter:我是如何用注解实现优雅限流的?</span>
  • 多歌曲风格切换编曲,盘点原创音乐人实用的5款AI编曲软件
  • 具有切换有向拓扑结构的通用线性多智能体系统的时变编队控制(有参考文献)附Matlab代码
  • 网络安全到底是啥?一篇看懂入门全攻略
  • 快速完成歌曲编曲伴奏的软件,盘点原创音乐人5款高效的AI编曲软件
  • SSM计算机毕设之基于ssm的社区外来务工人员信息登记、居住证办理管理系统的设计与实现(完整前后端代码+说明文档+LW,调试定制等)
  • 如何大批量上传❓超实用功能必看❗
  • 【Nmap 设备类型识别技术】整体概况
  • 计算机SSM毕设实战-基于ssm的种子商店网站的设计与开发种植知识科普种子商品管理【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • 【毕业设计】基于ssm的社区外来务工人员管理系统的设计与实现(源码+文档+远程调试,全bao定制等)
  • Stimulsoft Reports.AVALONIA 2026.1
  • 【毕业设计】基于ssm的种子商店网站的设计与开发(源码+文档+远程调试,全bao定制等)