当前位置：首页 > news >正文

实测腾讯混元HY-World 1.5：虚拟世界的推理实战

news 2026/3/26 23:03:31

实测腾讯混元HY-World 1.5：虚拟世界的推理实战

2025 年 12 月 17 日，腾讯混元发布并开源了 HY-World 1.5（WorldPlay），这款模型不仅是首个开源、实时交互并具备长期几何一致性的世界模型，更标志着 3D 世界生成技术的全新突破。

HY-World 1.5 采用 Next-Frames-Prediction 的视觉自回归任务进行训练，成功破解了同时满足实时性与几何一致性的难题，实现了长时几何一致性的实时世界交互。

除此之外，混元团队构建了自动化 3D 场景渲染流程，可以获得大量高质量的渲染数据，进一步激发核心算法的潜力。HY-World 1.5 可支持 24 帧 / 秒的长时流式生成，一致性与泛化能力适用于多样化场景。

相关链接：
👉直达Github

👉直达Hugging Face

👉直达官网

👉直达Lab4AI一键推理体验

效果展示
为了帮助大家更好地理解 HY-World 1.5 的强大功能，我们在腾讯混元的官网和 Lab4AI 平台分别进行了实测体验。

以下是我们测试中的实际效果和体验总结。

提示词：春雨连绵的江南水乡，青石板路被雨水打湿反光，白墙黑瓦的民居错落有致，河道上漂浮着乌篷船，岸边茶馆传来评弹声。

通过这个提示词，我们体验了 HY-World 1.5 的实时交互场景，操作非常直观。在官网上，你可以通过 WASD 键控制视角，享受完全沉浸感的虚拟世界体验。

同时，我们也在大模型实验室 Lab4AI 部署了推理环节，该推理为图生视频形式，以下是基于不同模型的推理结果展示：

1.双向模型（Bidirectional Model）
该模型适合场景生成、虚拟拍摄等要求稳定性的任务，视频内容非常符合预期。

效果展示：双向模型主要侧重于一致性和稳定性。生成的视频表现出极高的细节保真度，视觉效果非常精细，适合那些需要长时间稳定生成和高度一致性的应用场景。

小编在大模型实验室 Lab4AI 测试时，选择了 4 张 H800 的卡，耗时大约 20-25 分钟。

自回归模型（Autoregressive Model）
该模型适合快速生成任务，比如游戏场景或实时互动，速度明显提升，但在稳定性和一致性方面有所牺牲。

效果展示：自回归模型相比双向模型更注重推理速度，优化了生成过程的效率。它保持了视觉质量的同时，提高了推理的迭代速度，非常适合实时生成和互动场景。然而，相较于双向模型，其在细节保真度和一致性上略有降低。

小编在大模型实验室 Lab4AI 测试时，选择了 4 张 H800 的卡，耗时大约 10 分钟。

自回归蒸馏模型（Autoregressive Distilled Model）
该模型适合仿真数据合成、智能制造等应用场景，能够迅速生成大规模的虚拟环境数据，极大提升了任务效率。

效果展示：在自回归模型的基础上进行进一步优化，蒸馏模型专注于推理速度，尤其适用于大规模实时生成任务。它显著加快了生成过程，适用于需要快速迭代和实时反馈的虚拟仿真和数据合成任务。

小编在大模型实验室 Lab4AI 测试时，选择了 4 张 H800 的卡，耗时大约 5-6 分钟。

一键体验
👉直达Lab4AI一键推理体验

Step 1 进入项目
在 Lab4AI 平台上，搜索腾讯混元世界模型 1.5，即可找到项目。

Step 2 激活环境
进入项目页面后，打开 code 文件夹下的推理.ipynb 文件。在终端中激活所需环境，执行命令 conda activate worldplay，出现下图即成功激活。

Step 3 运行体验
所有模型已经部署完成，运行 bash run.sh 后，即可开始体验 HY-World 1.5 的强大推理能力，快速生成虚拟世界的视频内容。

Step 4 部分参数说明
1.替换输入图片

默认示例图片路径为 IMAGE_PATH=./assets/img/test.png，可以把自己的图片放到 ./assets/img/ 下，然后直接修改 IMAGE_PATH 指向新图片即可。需要注意：当前开源推理示例以 I2V（image-to-video）为主，因此 --image_path 不能为 None。

2.修改提示词 PROMPT

用来描述你希望生成的“世界/场景”与“风格倾向”。建议写法：先写场景主体（地形、建筑、道路、水体等），再写氛围与光照（清晨/黄昏/雾气/逆光），最后写镜头语言（静谧、电影感、写实/卡通、景深等）。

3.使用 REWRITE 优化提示词

如果希望自动润色/扩写 prompt，可将 REWRITE=true，并按官网要求配置重写服务，需要设置对应的 _REWRITE_BASE_URL 与 _REWRITE_MODEL_NAME 环境变量。若不想引入额外依赖，保持 REWRITE=false 即可。

4.自定义相机轨迹

推理命令已默认示例为 ./assets/pose/test_forward_32_latents.json。如果想实现环绕、推拉、平移等镜头运动，建议使用 generate_custom_trajectory.py 来生成自定义轨迹 JSON，然后把生成的 JSON 路径填回 run.sh 中的 POSE_JSON_PATH。

项目总结
HY-World 1.5（WorldPlay）是一款开创性的新型世界模型，它突破了传统视频生成的瓶颈，不仅在视频质量与一致性上取得了巨大的进展，还为未来的虚拟世界构建和数据生成提供了更多可能。

结合腾讯混元提供的实时推理能力，HY-World 1.5 为创作者、研究人员以及开发者提供了一个强大的工具平台，推动了下一代沉浸式数字体验的发展。

无论是虚拟拍摄、仿真数据合成，还是多视角任务驱动数据生成，HY-World 1.5 都能提供高效且一致的解决方案。

随着该技术的不断发展，可以预见，HY-World 1.5 将成为未来虚拟世界生成领域的关键技术之一，助力更多行业和领域的创新与突破。

快来大模型实验室 Lab4AI 体验 HY-World 1.5 的强大功能，带领你进入全新的虚拟世界！

查看全文

http://www.jsqmd.com/news/128252/