当前位置: 首页 > news >正文

AI 视频自动化学习日记 · 第一天

课程:第 11 章 AI 视频自动化(Coze)
日期:2026-03-16

这是什么?

AI 视频自动化,简单说就是用代码"写"视频

传统做视频要:写脚本 → 录音 → 找素材 → 剪辑 → 导出,一套下来少则几小时。

现在的思路是:让 AI 生成文案、语音、图片,再自动组装成剪映能识别的草稿文件,最后一键导出成片。原本 2 小时的活,5 分钟搞定。

核心工具链是三个:Coze + 速推/剪映小助手 + 剪映


怎么做?

三个角色分工

工具角色干什么
Coze大脑生成文案、调用 AI 生成图片/语音、构建时间线、组装草稿数据
剪映小助手配送员把云端草稿下载到本地、重写素材路径为本地路径
剪映执行者读取草稿文件、渲染画面、导出视频

核心原理

剪映的视频本质上是两个 JSON 文件:

  • draft_content.json— 时间线、素材引用、特效参数
  • draft_meta_info.json— 草稿基本信息

只要能生成正确的 JSON,就能"写"出一个视频。Coze 负责生成这个 JSON,剪映小助手负责把它送到剪映能找到的地方。


流程是什么?

第1步:Coze 生成内容 ├─ 文案 → 大模型生成 ├─ 语音 → 语音合成插件 ├─ 图片 → 图像生成插件 └─ 时间线 → 根据素材时长自动计算 第2步:组装草稿数据 ├─ create_draft → 建立空白画布 ├─ add_videos/images/audios/captions → 添加各轨道素材 └─ save_draft → 生成最终草稿链接 第3步:剪映小助手处理 ├─ 接收草稿链接 ├─ 下载到剪映草稿目录 └─ 重写素材路径为本地路径 第4步:剪映打开 └─ 自动识别草稿 → 编辑 → 导出

两种添加素材的方式

  • easy_create_material:入门用,自动对齐时间线,适合简单视频
  • add_*系列(add_videos / add_audios / add_images / add_captions):进阶用,手动控制时间线,适合批量生产和复杂视频

今天干了什么?

  1. 理解了核心原理:搞清楚剪映草稿本质是 JSON 文件,AI 视频自动化就是在自动生成这个 JSON。

  2. 搞懂了三者关系:Coze 是大脑,剪映小助手是配送员,剪映是执行者。为什么需要剪映小助手——因为 Coze 在云端,剪映只认本地文件,需要有人做"搬运+路径重写"。

  3. 了解了完整插件列表create_draftadd_*save_draft这条主线,以及easy_create_material这个快捷方式。

  4. 配置了开发环境

    • 安装剪映电脑版
    • 安装剪映小助手,配置草稿路径与剪映一致
    • 了解了 Coze 会员订阅(个人进阶版 19.9元/月)和付费插件说明
  5. 学会了复制工作流:Coze 画布里 Ctrl+A 全选、Ctrl+C 复制,可以把工作流配置导出为 JSON 分享给别人;也可以通过"创建副本"功能复制别人的工作流。


关键收获

视频 = JSON 文件。能生成 JSON,就能生成视频。

这个认知转变是今天最重要的东西。后续所有操作——添加素材、设置时间线、加字幕特效——本质上都是在构造这个 JSON 的不同字段。


下一步

  • 动手跑第一个create_draft+easy_create_material+save_draft的最小流程
  • 理解时间线数据结构(为后续add_*系列做准备)
  • 尝试入门篇案例:创建第一个空白视频项目

项目链接

课程开源链接🔗:https://github.com/datawhalechina/coze-ai-assistant/blob/main/Course_Center/chapter11/chapter11.md
课程日常更新链接🔗:https://zxdwhda-share.feishu.cn/wiki/ZSspwjpT4ioMXAkNYdfcOKE1nqd
课程推荐学习链接🔗:https://zxdwhda-share.feishu.cn/wiki/JNcKwVqA4ie6zykefvqcew62nWd

http://www.jsqmd.com/news/487992/

相关文章:

  • ROS2工具
  • 怎么提高迅雷下载速度_如何提升迅雷的下载速度
  • 防入侵!OpenClaw 本地部署对接 QQ:从部署到安全权限锁死全流程
  • 如何借助AI驱动工具提升化学研究效率?面向科研人员的智能解决方案
  • 2026最新Stripe OA面经分享|题库极小+高频负载均衡OOD真题全解析
  • 5个革命性的3D打印螺纹设计优化方案
  • Cadence 16.6实战:SOT23-6封装从焊盘到3D模型的完整制作流程
  • 蓝桥杯:直线
  • 告别黑苹果配置噩梦:OpCore Simplify如何让EFI构建像搭积木一样简单
  • 生成PPT网站推荐|AI博主实测,程序员/职场人告别熬夜排版
  • 六大Coding Plan 速度和tokens消耗测试!
  • ROS2跨架构部署实战:从x86到ARM64的交叉编译全流程解析
  • 信贷系统模型层表字段
  • 从“不会写代码”到亲手上线产品:Makund 与 Madav 眼中的 AI 软件新范式
  • GDScript零基础游戏开发学习指南:从新手到独立开发者的进阶之路
  • 告别乱码困扰:ConvertToUTF8的高效编码转换完全指南
  • GME多模态向量模型落地:企业知识库图文混合检索实战
  • 工业质检场景落地:Z-Image-Turbo生成缺陷样本辅助算法训练
  • QuickRecorder:重新定义macOS录屏体验的轻量化革新工具
  • 从物理学到5G:图解地面反射模型如何影响你的手机信号强度
  • 3大突破如何重塑Web机器学习开发?Transformers.js移动端AI框架深度解析
  • 本地化医疗AI新选择:MedGemma 1.5部署教程与效果展示
  • 从臃肿到轻盈:G-Helper如何重构华硕笔记本性能管理体系
  • 那些被Windows“藏起来”的功能:找回属于你的选择权
  • 从框架到分数:深度解读商用密码应用安全性量化评估实践
  • 腐烂国度1 MOD安装全攻略:从GenericModEnabler配置到实战避坑(附文件结构详解)
  • 如何解决Sublime Text乱码问题:编码转换工具完全指南
  • 开源工具本地化指南:Obsidian-i18n实现跨语言界面适配全流程
  • 如何用H5-Dooring实现零代码可视化开发:从入门到精通指南
  • 翻译GMTK的《塞尔达旷野之息开放世界设计》