当前位置: 首页 > news >正文

HeyGen 开源 HyperFrames:写 HTML 就能渲染视频,AI Agent 的视频生产工具

HeyGen 开源 HyperFrames:写 HTML 就能渲染视频,AI Agent 的视频生产工具

先收藏,回头一定用得上。

HeyGen(就是那个做 AI 数字人的公司)开源了一个项目叫 HyperFrames,口号很直白:Write HTML. Render video. Built for agents.

26700 Star,2500 Fork,3 个月从零到这个数字。它做的事情也直白:你写一个 HTML 文件,加上时间轴和动画,它帮你渲染成 MP4。没有 React 依赖,没有私有格式,没有按次收费。Apache 2.0 协议。

本文提纲

  1. 核心原理:HTML 怎么变成视频
  2. 一个完整的例子
  3. 专为 AI Agent 设计
  4. frame.md:设计系统到视频的翻译层
  5. 和 Remotion 对比
  6. Catalog:即插即用的组件库
  7. 谁在用、适合什么场景

核心原理:HTML 怎么变成视频

HyperFrames 的渲染流程很清晰:

  1. 你写一个 index.html,用 data-* 属性标注每个元素的时间轴(开始时间、持续时间、轨道编号)
  2. 渲染器在 headless Chrome 里逐帧 seek 这个 HTML 页面
  3. 每一帧截图,FFmpeg 编码成视频
  4. 最后混入音轨

因为是逐帧 seek(不是实时录制),所以同样的输入永远产出同样的视频——这对 CI/CD 和自动化渲染来说至关重要。

MERMAID_BLOCK_0

动画方面,你可以用 GSAP、CSS Animation、Lottie、Three.js、Anime.js、WAAPI——或者自己写 Frame Adapter。HyperFrames 不绑定任何动画库。

一个完整的例子

<div id="stage"data-composition-id="launch"data-start="0"data-width="1920"data-height="1080"><video class="clip"data-start="0"data-duration="6"data-track-index="0"src="intro.mp4"muted playsinline></video><h1 id="title"class="clip"data-start="1"data-duration="4"data-track-index="1">Launch day</h1><audio data-start="0"data-duration="6"data-track-index="2"data-volume="0.5"src="music.wav"></audio><script src="https://cdn.jsdelivr.net/npm/gsap@3/dist/gsap.min.js"></script><script>
    const tl = gsap.timeline({ paused: true });
    tl.from("#title", { opacity: 0, y: 40, duration: 0.8 }, 1);
    window.__timelines = window.__timelines || {};
    window.__timelines.launch = tl;
  </script>
</div>

核心就是 data-startdata-durationdata-track-index 这三个属性。加上 GSAP timeline 控制动画。浏览器里直接预览,命令行渲染成 MP4:

npx hyperframes init my-video
cd my-video
npx hyperframes preview    # 浏览器预览,支持热重载
npx hyperframes render     # 渲染成 MP4

要求:Node.js 22+ 和 FFmpeg。

专为 AI Agent 设计

这是 HyperFrames 和其他视频框架最大的不同。

它不是只给人用的工具——它把视频生产的完整流程编码成了 AI Agent 可以理解和执行的 Skill。安装方式:

npx skills add heygen-com/hyperframes

装好之后,你直接跟 Agent 说:

"用 HyperFrames 创建一个 10 秒的产品介绍视频,带淡入标题、背景视频和轻柔的背景音乐。"

Agent 会自动执行完整的视频生产循环:规划视频结构 → 写 HTML → 添加动画 → Lint 校验 → 预览 → 渲染。支持 Claude Code、Cursor、Gemini CLI、Codex 等主流编码 Agent。

这个设计思路很聪明:Agent 已经会写 HTML 了,不需要学新的领域特定语言。你只需要告诉它 data-* 属性的规则和时间轴的约定。

frame.md:设计系统到视频的翻译层

HyperFrames 还搞了一个有意思的东西叫 frame.md。

问题是这样的:每个品牌都有 design.md(颜色、字体、间距),但这些规范是给网页写的,不是给视频写的。视频有它自己的规则——画幅比例、安全区域、字幕位置、过渡节奏。

frame.md 就是这个翻译层:它把你的 web 设计规范"翻转"成视频语境下的规范,AI Agent 可以直接基于它来组合视频。

目前有十几个预设主题(Biennale Yellow、BlockFrame、Blue Professional、Bold Poster 等),可以直接在 hyperframes.dev/design 浏览和混搭。

和 Remotion 对比

HyperFrames 明确说了它受 Remotion 启发。两者都用 headless Chrome + FFmpeg 渲染视频,但设计哲学不同:

维度 HyperFrames Remotion
创作方式 纯 HTML + CSS React 组件
构建步骤 无,index.html 直接跑 需要 Bundler
Agent 友好度 HTML 文件,Agent 直接写 JSX/React 项目
动画模型 可 seek,帧精确 Wall-clock 模式需额外处理
分布式渲染 本地 + AWS Lambda Remotion Lambda(更成熟)
许可证 Apache 2.0 Source-available

一句话概括:Remotion 的赌注是 React 组件,HyperFrames 的赌注是人和 Agent 都能轻松写的纯 HTML。

Catalog:即插即用的组件库

不想从零写?有现成的:

npx hyperframes add flash-through-white   # Shader 过渡
npx hyperframes add instagram-follow      # 社交媒体叠加层
npx hyperframes add data-chart            # 动画图表

包括转场效果、社交叠加、字幕、图表、地图动画等。在 Catalog 浏览全部。

谁在用

HeyGen 自己内部生产环境在用。社区用户包括 tldraw、TanStack 等团队。适合的场景:

  • 产品发布视频和功能介绍
  • PR 演示视频(带代码 diff 动画、旁白、字幕)
  • 数据可视化和图表竞赛
  • 社交媒体短视频(动态字幕、叠加层、音乐)
  • 文档转视频 / PDF 转视频
  • 自动化内容流水线的可复用动效模板

AWS Lambda 渲染方案也有,适合 CI/CD 集成和批量渲染。

试过了?评论区说说你拿它做了什么视频。还没试?收藏起来周末折腾。


作者: itech001
来源: 公众号:AI人工智能时代
网站: https://www.theaiera.cn/
每日分享最前沿的AI新闻资讯和技术研究。

本文首发于 AI人工智能时代,转载请注明出处。

http://www.jsqmd.com/news/994704/

相关文章:

  • 2026古木家具收藏新手全程指南!从入门鉴藏到安全出手一站式攻略 - 深鉴新闻
  • 深入解析PCA9670 I2C I/O扩展器:硬件复位与高电流驱动实战
  • BuildingAI实战:爆火Image-2+香蕉绘画,搭建AI绘画写作平台
  • CRMEB Pro 接入 AI 客服/导购:商品、订单、用户数据怎么变成智能问答
  • 深入理解 JavaScript 数据类型:从冯·诺依曼架构到八种数据类型
  • 2026年冷库工程厂家推荐排行榜:食品/小型/广州/白云区/广东冷库工程,专业建造实力之选! - 信息热点
  • 2026年深圳全屋定制预算大概多少合适?我做完这套236㎡大平层才发现,省下15万全靠这招 - 产品测评官
  • 入手二手特斯拉怎么找靠谱验车?主流验车平台真实使用体验 - 信息热点
  • 如何实现自动化文档转换:Notion规范到代码实现的5大优势
  • 2026 年 6 月二级建造师模拟考试 APP 实测,全真模考避坑指南 - 讲清楚了
  • MC9S08SH8电气特性与EMC设计实战:从数据手册到稳定硬件
  • 如何用免费Ink/Stitch插件将矢量设计变为专业刺绣:开源刺绣设计的完整指南
  • ComfyUI-LTXVideo:LTX-2视频生成模型的完整实践指南
  • 2026企业微信SCRM怎么挑选?看这3个维度就够了 - 信息热点
  • 拯救者生态互联教程!Legion Zone 跨端配对全步骤与避坑指南
  • 神经符号AI新篇章:模态逻辑如何让AI“懂”规则与可能性?
  • 肇庆CMA甲醛检测治理公司2026避雷手册:Top5品牌横向对比与科学选择 - AZJ888
  • 杭州巴黎世家、芬迪包包回收实测 - 奢侈品回收评测
  • 别再手动对齐坐标系了!用Threebox在Mapbox GL JS里轻松添加3D模型(React Hooks实战)
  • 【毕业设计】面向校园场景的 HarmonyOS 智能学生考勤系统设计与实现基于HarmonyOS的学生考勤系统的设计与实现(源码+文档+远程调试,全bao定制等)
  • AI风口下亨通光电市值暴涨近2000亿,拟分拆子公司亨通华海冲刺科创板
  • 将闲置电视盒子变身高性能Armbian服务器:S905X3终极改装指南
  • 宿迁母婴除甲醛检测治理公司2026避雷手册:Top5品牌横向对比与科学选择 - AZJ888
  • 九章AI编程:高并发定时调度引擎
  • 2026年口碑好的 烟台出国留学机构、烟台小语种培训机构排行:合规性与服务实力实测对比 - 起跑123
  • TrollInstallerX终极指南:3分钟掌握iOS越狱安装技巧
  • Claude Fable 5遭多智能体越狱攻击:Anthropic最强AI安全防线被击穿,12万字符系统提示泄露
  • 肇庆CMA甲醛检测治理公司2026挑选指南:Top5品牌横向对比与科学选择 - AZJ888
  • 计算机毕业设计之基于Python的课程网站的设计与实现
  • 智慧医疗中心静脉置管操作设施设备器具器材识别分割数据集labelme格式2773张7类别