当前位置: 首页 > news >正文

LongLive 2.0:NVFP4 并行架构助力长视频生成,最高推理速度达 45.7 FPS!

内容概要

采用 NVFP4 技术并在训练和推理阶段均实现并行处理的架构。

新闻动态

2026 年 5 月 13 日,发布 LongLive 2.0,这是一个采用 NVFP4、具备并行处理能力且支持多镜头 AR 训练、DMD 蒸馏和推理(速度达 45.7 FPS)的架构。原始的 LongLive 1.0 代码现已移至 v1.0 分支。

2026 年 4 月 12 日,LongLive 支持使用 TriAttention 进行 kv 缓存压缩,可减少 50% 的 KV 占用且不降低质量。

2026 年 1 月 27 日,LongLive 被 ICLR - 2026 会议接收。

2026 年 1 月 11 日,LongLive 支持将原始的 RoPE 适配为 KV - cache 相对 RoPE,能够生成无限长的视频。

2025 年 11 月 3 日,在线性注意力模型 SANA - Video 上实现了 LongLive,现在 SANA - Video 可以实时生成 60 秒的交互式视频。

2025 年 9 月 29 日,发布了论文、包含所有训练和推理代码的 GitHub 仓库 LongLive、模型权重 LongLive - 1.3B 以及演示页面网站。

简介

LongLive 1.0:实时交互式长视频生成

可以在 V1.0 分支中找到相关内容。它能够接收用户的连续提示并实时生成相应的视频,支持用户引导的长视频生成。其关键特性包括注意力汇聚、KV 重缓存和流式长调优。

LongLive 2.0:用于长视频生成的 NVFP4 并行架构

训练方面:支持用于 AR 训练(教师强制)的平衡序列并行,可对多镜头(或单镜头)视频进行 AR 训练。在 AR 训练和少步蒸馏中均支持 NVFP4(或 BF16)。

推理方面:支持 NVFP4 推理(W4A4)和 NVFP4 KV 缓存、多镜头注意力汇聚、序列并行推理和异步解码。

快速上手

完整文档

安装、NVFP4 设置、训练、推理、数据组织

快速开始
BF16

给出了相应的代码示例,`place_vae_for_streaming` 函数仅在 `inference.streaming_vae` 为 `true` 且设置了 `inference.vae_device` 时才会起作用,只需在 YAML 文件中切换流式管道解码设置即可,脚本无需更改。

NVFP4

将 `configs/nvfp4/inference_nvfp4.yaml` 中的 `checkpoints.generator_ckpt` 指向下载的检查点,并根据使用的后端设置 `model_quant_use_transformer_engine`。`setup_nvfp4_pipeline` 函数负责处理检查点加载、NVFP4 模块包装、权重实例化、数据类型/设备放置以及两种后端的流式管道 VAE 重定位。这里不能使用 `bf16 pipe.to(...)` 快捷方式,因为它会转换量化缓冲区。也给出了相应的代码示例。

模型

列出了不同模型的 FPS、参数、VBench 等信息,如 LongLive - 1.3B、LongLive - 2.0 - 5B、LongLive - 2.0 - 5B - NVFP4 - 4Step、LongLive - 2.0 - 5B - NVFP4 - 2Step。

许可证

本仓库遵循 Apache 2.0 许可证。详情请见 `LICENSE` 文件。

引用

给出了引用的 bibtex 格式。

致谢

Self - Forcing:构建的 AR 训练代码库和公式基础。Wan2.2:本版本中使用的基础视频扩散模型组件。

http://www.jsqmd.com/news/876835/

相关文章:

  • SPT-AKI存档编辑器完全指南:3分钟掌握离线塔科夫存档修改技巧
  • Arm物理IP去耦电容单元解析与应用指南
  • 豆包图片去水印(一秒去除) - 政企云文档
  • Maalox和Mylanta的区别
  • 3分钟解决Windows激活烦恼:开源KMS工具终极使用指南
  • 如何用DeepL Chrome翻译插件打破语言障碍:从安装到精通的完整指南
  • Zotero-GPT终极指南:3分钟解决“密钥未配置“错误,开启AI文献管理新时代
  • 如何免费实现NVIDIA显卡专业级色彩校准:novideo_srgb终极指南
  • 终极解决方案:如何用qmc-decoder快速解锁QQ音乐加密格式
  • 鸣潮工具箱WaveTools:3分钟解锁高帧率与专业数据分析完整指南
  • 南昌县2026最新黄金回收本地口碑商家榜:黄金首饰+白银+铂金+彩金回收门店及联系方式推荐 - 前途无量YY
  • 3分钟解锁SketchUp STL插件:你的3D打印模型转换终极方案
  • Unity SDK治理革命:EDM4U如何实现确定性集成
  • 3分钟掌握QMC音频解密:qmc-decoder实战指南与算法深度解析
  • 大语言模型驱动的定性研究编码自动化:GATOS工作流实践指南
  • 3分钟变中文!FigmaCN让设计效率提升50%的秘密
  • 终极免费方案:3种方法轻松获取Grammarly Premium高级Cookie
  • 秦皇岛黄金回收|赵掌柜二奢店(海港区毓典商贸店)正规经营 联系电话18531172838 - 品牌企业推荐师(官方)
  • iOS 26.4-26.5终极越狱指南:解锁iPhone隐藏功能与高级定制方案
  • 2026 北京不同场景宠物走失指南:小区 / 山林 / 高层该找什么样的团队 - 品牌企业推荐师(官方)
  • MPC5604B/C 电源系统全解|车规级电源架构、低功耗、稳压、LVD 一站式吃透
  • 如何在Windows上快速安装苹果设备驱动:告别连接烦恼的完整指南
  • 掌控你的塔科夫世界:SPT-AKI存档编辑器完全指南
  • JS-Vue
  • Adobe GenP 3.0自动化破解解决方案:实现Adobe CC全版本批量激活的技术实现
  • 高效开源实时屏幕翻译工具:Translumo完整使用指南
  • 中国隐秘的海上仙境,不输马尔代夫,就在西沙七连屿-赵述岛! - 奔跑123
  • SAS、Stata、R、SPSS、Mplus、HLM:六款主流统计软件做多层线性模型,到底该选哪个?(附完整代码对比)
  • 2026年想入手靠谱床垫?赣州南康正规生产厂家选购攻略奉上 - 品牌企业推荐师(官方)
  • 解锁QQ音乐加密格式:qmc-decoder让你真正拥有自己的音乐