当前位置: 首页 > news >正文

实测腾讯混元HY-World 1.5:虚拟世界的推理实战

实测腾讯混元HY-World 1.5:虚拟世界的推理实战


2025 年 12 月 17 日,腾讯混元发布并开源了 HY-World 1.5(WorldPlay),这款模型不仅是首个开源、实时交互并具备长期几何一致性的世界模型,更标志着 3D 世界生成技术的全新突破。

HY-World 1.5 采用 Next-Frames-Prediction 的视觉自回归任务进行训练,成功破解了同时满足实时性与几何一致性的难题,实现了长时几何一致性的实时世界交互。

除此之外,混元团队构建了自动化 3D 场景渲染流程,可以获得大量高质量的渲染数据,进一步激发核心算法的潜力。HY-World 1.5 可支持 24 帧 / 秒的长时流式生成,一致性与泛化能力适用于多样化场景。

相关链接:
👉直达Github

👉直达Hugging Face

👉直达官网

👉直达Lab4AI一键推理体验

效果展示
为了帮助大家更好地理解 HY-World 1.5 的强大功能,我们在腾讯混元的官网和 Lab4AI 平台分别进行了实测体验。

以下是我们测试中的实际效果和体验总结。

提示词:春雨连绵的江南水乡,青石板路被雨水打湿反光,白墙黑瓦的民居错落有致,河道上漂浮着乌篷船,岸边茶馆传来评弹声。
image
通过这个提示词,我们体验了 HY-World 1.5 的实时交互场景,操作非常直观。在官网上,你可以通过 WASD 键控制视角,享受完全沉浸感的虚拟世界体验。

同时,我们也在大模型实验室 Lab4AI 部署了推理环节,该推理为图生视频形式,以下是基于不同模型的推理结果展示:

1.双向模型(Bidirectional Model)
该模型适合场景生成、虚拟拍摄等要求稳定性的任务,视频内容非常符合预期。
image
效果展示:双向模型主要侧重于一致性和稳定性。生成的视频表现出极高的细节保真度,视觉效果非常精细,适合那些需要长时间稳定生成和高度一致性的应用场景。

小编在大模型实验室 Lab4AI 测试时,选择了 4 张 H800 的卡,耗时大约 20-25 分钟。

  1. 自回归模型(Autoregressive Model)
    该模型适合快速生成任务,比如游戏场景或实时互动,速度明显提升,但在稳定性和一致性方面有所牺牲。
    image
    效果展示:自回归模型相比双向模型更注重推理速度,优化了生成过程的效率。它保持了视觉质量的同时,提高了推理的迭代速度,非常适合实时生成和互动场景。然而,相较于双向模型,其在细节保真度和一致性上略有降低。

小编在大模型实验室 Lab4AI 测试时,选择了 4 张 H800 的卡,耗时大约 10 分钟。

  1. 自回归蒸馏模型(Autoregressive Distilled Model)
    该模型适合仿真数据合成、智能制造等应用场景,能够迅速生成大规模的虚拟环境数据,极大提升了任务效率。
    image
    效果展示:在自回归模型的基础上进行进一步优化,蒸馏模型专注于推理速度,尤其适用于大规模实时生成任务。它显著加快了生成过程,适用于需要快速迭代和实时反馈的虚拟仿真和数据合成任务。

小编在大模型实验室 Lab4AI 测试时,选择了 4 张 H800 的卡,耗时大约 5-6 分钟。

一键体验
👉直达Lab4AI一键推理体验

Step 1 进入项目
在 Lab4AI 平台上,搜索腾讯混元世界模型 1.5,即可找到项目。
image

Step 2 激活环境
进入项目页面后,打开 code 文件夹下的推理.ipynb 文件。在终端中激活所需环境,执行命令 conda activate worldplay,出现下图即成功激活。
image

Step 3 运行体验
所有模型已经部署完成,运行 bash run.sh 后,即可开始体验 HY-World 1.5 的强大推理能力,快速生成虚拟世界的视频内容。
image

Step 4 部分参数说明
1.替换输入图片

默认示例图片路径为 IMAGE_PATH=./assets/img/test.png,可以把自己的图片放到 ./assets/img/ 下,然后直接修改 IMAGE_PATH 指向新图片即可。需要注意:当前开源推理示例以 I2V(image-to-video) 为主,因此 --image_path 不能为 None。

2.修改提示词 PROMPT

用来描述你希望生成的“世界/场景”与“风格倾向”。建议写法:先写场景主体(地形、建筑、道路、水体等),再写氛围与光照(清晨/黄昏/雾气/逆光),最后写镜头语言(静谧、电影感、写实/卡通、景深等)。

3.使用 REWRITE 优化提示词

如果希望自动润色/扩写 prompt,可将 REWRITE=true,并按官网要求配置重写服务,需要设置对应的 _REWRITE_BASE_URL 与 _REWRITE_MODEL_NAME 环境变量。若不想引入额外依赖,保持 REWRITE=false 即可。

4.自定义相机轨迹

推理命令已默认示例为 ./assets/pose/test_forward_32_latents.json。如果想实现环绕、推拉、平移等镜头运动,建议使用 generate_custom_trajectory.py 来生成自定义轨迹 JSON,然后把生成的 JSON 路径填回 run.sh 中的 POSE_JSON_PATH。

项目总结
HY-World 1.5(WorldPlay)是一款开创性的新型世界模型,它突破了传统视频生成的瓶颈,不仅在视频质量与一致性上取得了巨大的进展,还为未来的虚拟世界构建和数据生成提供了更多可能。

结合腾讯混元提供的实时推理能力,HY-World 1.5 为创作者、研究人员以及开发者提供了一个强大的工具平台,推动了下一代沉浸式数字体验的发展。

无论是虚拟拍摄、仿真数据合成,还是多视角任务驱动数据生成,HY-World 1.5 都能提供高效且一致的解决方案。

随着该技术的不断发展,可以预见,HY-World 1.5 将成为未来虚拟世界生成领域的关键技术之一,助力更多行业和领域的创新与突破。

快来大模型实验室 Lab4AI 体验 HY-World 1.5 的强大功能,带领你进入全新的虚拟世界!

http://www.jsqmd.com/news/128252/

相关文章:

  • Comso多层膜石墨烯传感器技术揭秘与应用前景展望
  • QQ空间历史说说终极备份指南:3步轻松导出所有回忆
  • 8个AI写作工具,专科生论文格式规范轻松搞定!
  • GHelper硬件控制大师:华硕ROG笔记本的性能调校指南
  • 中国 A 股上市公司气候变化减缓专利技术专利数量数据 1994-2024(附原始专利)
  • 云服务器安装宝塔教程
  • Steamauto 5.5.0终极指南:如何实现全自动Steam交易管理
  • 揭秘Open-AutoGLM搭建全过程:5大核心步骤与避坑要点全公开
  • 广西崇左市自建房设计公司/机构权威测评推荐排行榜 - 苏木2025
  • 告别手动操作,Open-AutoGLM 网页插件让浏览器自己干活,效率翻倍不是梦
  • OllyDbg调试图解:用户态程序函数调用栈的可视化分析
  • BetterGI深度解析:三大自动化模块如何让你的原神游戏体验焕然一新?
  • 基于springboot和vue框架的医院门诊坐诊挂号管理系统_05am16pp功能多-
  • Open-AutoGLM使用内幕:9大关键场景还原真实开发体验
  • Open-AutoGLM 电脑版实测指南(专家级配置与调优秘籍)
  • 【2025市场分析】瓶盖扭矩仪实力生产商推荐!附选购指南 - 品牌推荐大师
  • NVIDIA Profile Inspector:深入显卡配置的开发者工具
  • 基于OAuth滥用的定向钓鱼攻击与防御机制研究
  • LeagueAkari:英雄联盟玩家的智能游戏助手
  • 哔哩下载姬DownKyi终极教程:从零开始完整掌握B站视频下载
  • OpenCore Legacy Patcher深度解析:老款Mac设备现代化升级实战手册
  • 2025年地坪源头厂家最新推荐榜单:固化地坪、钢屑地坪、环氧地坪、环氧磨石地坪、聚氨酯砂浆地坪、聚氨酯地坪、硅PU球场地坪、丙烯酸球场地坪 - 呼呼拉呼
  • 高性能摩托车弹簧厂家推荐,振东弹簧铸就品质传奇 - mypinpai
  • 科研新范式:书匠策AI如何以“智能画笔”重构期刊论文创作生态?
  • 程序性能优化与算法效率的解析
  • MuddyWater组织针对关键基础设施的鱼叉钓鱼攻击机制与防御体系研究
  • 2025年办理速度快的移民公司推荐:靠谱的移民公司服务找哪家? - 工业品牌热点
  • 揭秘Open-AutoGLM微信集成方案:如何用5步实现智能对话自动响应
  • 第一性原理解读
  • GhostFrame钓鱼框架的隐蔽iframe架构与检测对抗机制研究