HyperFrames:写 HTML 就能出视频,专为 AI Agent 设计
- Smars
- Agent Skills , 开源工具
- 05 Jun, 2026
做视频很慢。
传统视频工具是时间轴驱动的:拖素材、调关键帧、渲染、导出、修改、再渲染。你没法自动化这个流程,更没法让 AI 帮你做——因为 Premiere 不接受 prompt。
如果你想让代码批量生成视频,或者让 AI agent 独立完成一支视频,大多数方案会跟你翻脸。
HyperFrames 的解法很直接:把视频当代码写。HTML 是你会的,CSS 是你会的,动画库随你选。写完保存,浏览器预览。确认没问题,一条命令出 MP4。
而且它是 24k star 的 Apache 2.0 开源项目,没有按次渲染收费,没有商业授权门槛。
技能能做什么,不能做什么
安装 HyperFrames Skills 后,你的 AI 编程助手(Claude Code、Cursor、Gemini CLI、Codex 等)会获得一套完整的视频生产指令。它不是一个”一键生成视频”的魔法工具,而是一个让 Agent 知道怎么搭建视频项目的技能包。
Skills 提供的能力:
- 项目脚手架:Agent 会调
npx hyperframes init初始化视频项目目录 - 写 HTML 和 CSS:Agent 按照你描述的场景,写布局、排版、颜色、动画
- 接线动画:Agent 用 GSAP、CSS Animation、Lottie 等库写可 seek 的动画时间线
- Lint 检查:Agent 会验证 HTML 结构和数据属性的正确性
- 预览和渲染:Agent 调
npx hyperframes preview和npx hyperframes render完成预览和导出 - 设计模板:Agent 可以从 10 套 frame.md 模板中选择配色和排版方案
- Component Catalog:Agent 可以安装复用组件——转场特效、图表动画、字幕叠加、社交贴纸等
Skills 不提供的东西:
- 不生成图片:产品截图、插图、背景图需要你自己准备
- 不生成视频素材:B-roll、背景视频需要你自己提供
- 不生成音频:背景音乐、旁白配音需要你自己录制或下载
- 不生成 AI 数字人:HyperFrames 只管合成和渲染,不生成内容资产
一句话总结:你提供素材,Agent 写代码组装,HyperFrames 渲染出 MP4。
完整使用流程
1. 安装 Skills
在你的项目目录下运行:
npx skills add heygen-com/hyperframes
这条命令会把 HyperFrames 的生产规范下载到项目中的 .agents/skills/ 目录。之后你的 AI 编程助手就能响应 hyperframes 相关的指令。
2. 准备素材
把你要用的图片、视频片段、音频文件准备好。支持的格式:
- 图片:PNG、JPG、WebP、SVG
- 视频:MP4
- 音频:WAV、MP3
这些是你自己要提供的。如果你需要 AI 数字人出镜,可以用 HeyGen 生成数字人视频后,再导入 HyperFrames 做合成。
3. 给 Agent 下指令
打开你的 AI 编程助手,直接用自然语言描述:
用 hyperframes 创建一个 10 秒的产品介绍视频,带淡入标题、背景视频和轻背景音乐。
素材在 assets/ 目录下。
Agent 会自动执行以下步骤:
- 规划视频结构(几个镜头、每个镜头多长、出现顺序)
- 用
npx hyperframes init创建项目脚手架 - 写
index.html——布局、CSS 样式、数据属性 - 写动画时间线——GSAP 或 CSS Animation
- 引用你提供的素材文件
- 跑
npx hyperframes lint检查语法 - 跑
npx hyperframes preview打开浏览器预览 - 你确认效果后,Agent 跑
npx hyperframes render导出 MP4
整个过程中你不需要打开任何视频编辑软件。
4. 检查和导出
每次渲染都是确定性的——同一个 index.html,每次出完全相同的 MP4。所以你可以把视频项目放进 Git,在 CI 里跑渲染,做回归测试。
上手示例:一个 5 秒的标题动画视频
下面用一个极简示例,把安装、用 Agent、出视频的完整链路跑通。整个过程不需要任何外部素材,只有文字、颜色和动画。你会清楚地看到:每一样东西是谁生成的、Agent 做了哪些事、最终视频是怎么出来的。
第 1 步:安装 Skills 并确保环境就绪
如果你的编程助手还没装 Skills:
npx skills add heygen-com/hyperframes
这条命令把 HyperFrames 的生产规范(项目结构、HTML 语法、动画接线方式、lint 规则)下载到 .agents/skills/。之后 Agent 就知道怎么写视频了。
确保本地装了 Node.js 22+ 和 FFmpeg——这是渲染引擎的依赖。
第 2 步:让 Agent 创建项目
在编程助手里说:
用 hyperframes 创建一个 5 秒的标题动画视频 demo。
背景用紫蓝渐变,标题 "Hello HyperFrames",副标题 "写 HTML,出视频",
标题和副标题依次淡入上浮。不需要外部素材。
Agent 会执行完整的生产链路:
- 调
npx hyperframes init demo初始化项目目录 - 规划 5 秒视频的时间结构:标题从 0.5s 开始、副标题从 1.2s 开始
- 写
index.html:包含<style>里的布局和颜色、<div id="stage">里的视频 Composition、数据属性定义轨道和时间 - 写 GSAP 动画时间线:标题和副标题的 opacity + y 位移,用
paused: true模式让 HyperFrames 能逐帧 seek - 跑
npx hyperframes lint检查语法 - 跑
npx hyperframes preview在浏览器里实时看效果
第 3 步:看 Agent 生成的 index.html
Agent 写完的 demo/index.html 大致是这样的:
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<title>Demo</title>
<style>
* { margin: 0; padding: 0; box-sizing: border-box; }
body {
width: 1920px; height: 1080px;
background: linear-gradient(135deg, #667eea 0%, #764ba2 100%);
display: flex;
align-items: center;
justify-content: center;
overflow: hidden;
font-family: system-ui, sans-serif;
}
.center {
text-align: center;
color: white;
}
.center h1 {
font-size: 96px;
font-weight: 800;
margin-bottom: 16px;
}
.center p {
font-size: 36px;
font-weight: 300;
opacity: 0.8;
}
</style>
</head>
<body>
<div id="stage" data-composition-id="main" data-start="0" data-width="1920" data-height="1080">
<section class="clip center" data-start="0" data-duration="5" data-track-index="0">
<h1>Hello HyperFrames</h1>
<p>写 HTML,出视频</p>
</section>
</div>
<script src="https://cdn.jsdelivr.net/npm/gsap@3/dist/gsap.min.js"></script>
<script>
const tl = gsap.timeline({ paused: true });
tl.from("h1", { opacity: 0, y: 60, duration: 1, ease: "power3.out" }, 0.5);
tl.from("p", { opacity: 0, y: 30, duration: 0.8, ease: "power3.out" }, 1.2);
window.__timelines = window.__timelines || {};
window.__timelines.main = tl;
</script>
</body>
</html>
注意这个例子里:
- 图片:没有用任何图片。渐变背景和文字排版是 CSS 写的,由 HyperFrames 渲染引擎在 headless Chrome 里逐帧绘制出来的。如果你需要在视频里放产品截图,把图片文件放在
demo/目录下,Agent 会在 HTML 里用<img src="screenshot.png">引用——图片是你提供的,不是 Agent 生成的。 - 视频素材:没有用任何视频片段。所有动态效果都来自 GSAP 写的动画时间线——文字淡入(opacity 从 0 到 1)和上移(y 从偏移值到 0)。如果你需要背景视频,把 mp4 文件放在项目目录,Agent 会用
<video src="...">引用——视频素材是你提供的,不是 Agent 生成的。 - 音频:没有用任何音频文件。这个 demo 是无声的。如果你需要背景音乐或旁白,把 wav/mp3 文件放在项目目录,Agent 会用
<audio src="...">引用——音频文件是你提供的,不是 Agent 生成的。 - 动画:GSAP 动画是 Agent 写的 JavaScript 代码,
paused: true+window.__timelines是 HyperFrames 要求的 seekable 动画模式,确保渲染引擎能跳转到任意帧。 - 视频渲染:最终 MP4 由
npx hyperframes render调 headless Chrome 逐帧截图 + FFmpeg 编码生成——这是 HyperFrames 做的事,不是 Agent 做的。Agent 只负责写 HTML 和调命令。
第 4 步:预览和渲染
Agent 验证语法没问题后:
npx hyperframes preview # 在浏览器里看效果,确认排版和动画
npx hyperframes render # 导出 demo.mp4
你会在 demo/ 目录下得到 demo.mp4。一个紫蓝渐变背景上,标题和副标题依次淡入上浮的 5 秒动画视频。
第 5 步:改造成你自己的视频
把刚才的 HTML 拿给 Agent:“把标题改成我的产品名,颜色换成我的品牌色,加一个 PNG logo 在左上角”。Agent 会改 CSS 渐变色值、替换文字、加 <img> 引用你的 logo 文件。你只需要提供 logo.png,别的都是 Agent 搞定。
核心设计:HTML 即是视频源文件
HyperFrames 的核心理念是一个直觉到会被忽视的想法:浏览器能渲染的任何东西,都应该能输出为视频。
你的项目目录里会有一个 index.html 文件,里面就是一个完整的视频 Composition:
<div id="stage" data-composition-id="launch" data-start="0" data-width="1920" data-height="1080">
<video
class="clip"
data-start="0"
data-duration="6"
data-track-index="0"
src="intro.mp4"
muted
playsinline
></video>
<h1 id="title" class="clip" data-start="1" data-duration="4" data-track-index="1">Launch day</h1>
<audio
data-start="0"
data-duration="6"
data-track-index="2"
data-volume="0.5"
src="music.wav"
></audio>
<script src="https://cdn.jsdelivr.net/npm/gsap@3/dist/gsap.min.js"></script>
<script>
const tl = gsap.timeline({ paused: true });
tl.from("#title", { opacity: 0, y: 40, duration: 0.8 }, 1);
window.__timelines = window.__timelines || {};
window.__timelines.launch = tl;
</script>
</div>
数据属性(data-start、data-duration、data-track-index)告诉引擎每个元素什么时候出现、持续多长、属于哪个轨道。动画用你熟悉的库——GSAP、CSS Animation、Lottie、Three.js、Anime.js、WAAPI 都行。
然后三条命令走完全程:
npx hyperframes init my-video # 脚手架
npx hyperframes preview # 浏览器实时预览
npx hyperframes render # 渲染出 MP4
渲染引擎在 headless Chrome 中逐帧截图,用 FFmpeg 编码成视频。同一个 HTML 输入,每次出完全相同的 MP4 输出。CI 可跑,回归可测,Agent 可控。
为什么 Agent 需要它
AI 编程助手已经能写 HTML 了——而且写得不错。但你让它做视频,它会懵。
原因很简单:现有的视频工作流不是文件驱动的。After Effects、Premiere、Final Cut 都依赖 GUI 操作,Agent 拿不到一个”可编辑的源文件”。
HyperFrames 改变了这个前提:Agent 不需要操作视频工具,它只需要写 HTML。
Skills 安装后,Agent 就拥有了完整的视频生产知识——从项目结构、HTML 语法规范、动画接线方式,到 lint 检查、预览和渲染命令。Agent 负责组装,你负责提供素材和审核结果。
frame.md:把设计系统翻译成视频语言
你的团队大概率有一份 design.md,定义了颜色、字体、间距。但这些东西面向的是网页和 App,不是 1920×1080 的 24fps 画面。
frame.md 解决的就是这个断层。
它接收你现有的设计规范,生成一份视频专用的设计指令:同样的颜色 Token、同样的字体规则,但重写成 Agent 能直接用来构图的内容——元素应该多大、动画应该多快、画面应该怎么留白。
输出是 DESIGN.md 的超集,你的整个工具链都能读。目前有 10 套模板可直接使用:Biennale Yellow、BlockFrame、Blue Professional、Bold Poster、Broadside、Capsule、Cartesian、Cobalt Grid、Coral、Creative Mode。
适合什么场景
产品发布视频和功能更新。
你已经有产品截图和文案。用 HTML 拼好布局,加 fade-in 和 slide-up,导出就是一支不丢人的发布视频。改文案不需要重新做,改 HTML 就行。
可重复使用的自动化视频管道。
把数据灌进 HTML 模板——报表、天气、比分、监控大盘——定时渲染成视频,推送到社交媒体。这个工作流里没有人需要打开剪辑软件。
Agent 驱动的视频生产。
PR 走查视频、文档转视频讲解、数据可视化动效——凡是”内容有规律、需要批量产出”的视频需求,都适合交给 HyperFrames。Agent 处理结构和逻辑,你只需要把关最终效果。
和 Remotion 的区别
HyperFrames 明确受 Remotion 启发。两者都用 headless Chrome + FFmpeg 渲染视频。
区别在创作模型:
| 维度 | HyperFrames | Remotion |
|---|---|---|
| 创作方式 | 纯 HTML + CSS + 可 seek 动画 | React 组件 |
| 构建步骤 | 无,index.html 即开即用 | 需要 Bundler |
| Agent 友好度 | 原生支持,Agent 直接写 HTML 文件 | 需要理解 React/JSX 项目结构 |
| 分布式渲染 | 本地 + AWS Lambda | Remotion Lambda(成熟云渲染) |
| 许可证 | Apache 2.0 | Remotion License(源码可用) |
选 HyperFrames 的理由很明确:如果你想让 Agent 做视频,或者你不想在视频项目里引入 React。选 Remotion 的理由也明确:如果你的前端团队已经深度使用 React,Remotion 的组件模型会让你更顺手。
注意事项
它不是 After Effects 的替代品。
如果你想做复杂的运动图形、粒子特效或手动调色的精细动画,After Effects 仍然更合适。HyperFrames 的优势在自动化、可重复、Agent 可操作,不是手调级精细度。
你需要自己准备素材。
图片、视频片段、音频文件都需要你提供。Skills 让 Agent 学会组装视频,但不会凭空生成内容资产。如果你需要 AI 数字人,可以用 HeyGen 生成数字人后导入 HyperFrames 合成。
你需要会用 HTML 和 CSS。
这个门槛很低,但不是零。如果你完全不会前端,入门会比预想中慢。好消息是 Agent 能帮你写大部分 HTML,你只需要审查和调整。
视频渲染需要算力。
本地渲染依赖 headless Chrome + FFmpeg,长视频或高分辨率会占用大量 CPU。如果需要高频渲染,建议走 AWS Lambda 分布式方案。
动画时间控制有学习成本。
HyperFrames 用的是 seekable animation——时间轴需要能跳转到任意帧并保持状态一致。GSAP 的 paused: true + seek() 模式可以做到,但如果你习惯的是 wall-clock 动画(比如直接用 setTimeout 控制时序),需要适应这种写法。
结尾
视频生产的瓶颈不是工具不够多,而是工具没有为代码和自动化设计过。
HyperFrames 做的事很简单:把视频格式从时间轴文件变成 HTML 文件。这个转变意味着三件事——你可以用 Git 管版本,你可以用 CI 跑渲染,你的 Agent 可以独立产出完整的视频。
如果你已经在用 AI 编程助手,HyperFrames 是你离”让 Agent 做视频”最近的一步。
GitHub: https://github.com/heygen-com/hyperframes
设计模板: https://www.hyperframes.dev/design
Playground: https://www.hyperframes.dev