当前位置: 首页 > news >正文

AI Comic Builder v0.2.0 – v0.2.2 功能更新全览:从剧本导入到提示词工程,AI 动画创作全面进化

三个版本,三次飞跃——剧本智能导入、提示词管理系统、Veo 全系列适配,让 AI 动画创作从「能用」走向「好用」。


GitHub: https://github.com/twwch/AIComicBuilder

版本概览

版本主题核心能力
v0.2.0剧本导入 Pipeline上传小说/剧本,AI 自动拆集建角
v0.2.1提示词管理系统12 个提示词插槽,全局/项目级自定义,版本历史
v0.2.2Veo 模型适配 & AI 优化Google Veo 2.0/3.0/3.1 全系列支持,一键 AI 润色

一、剧本导入 Pipeline:四步流水线,全程可视化(v0.2.0)

这是 v0.2.0 最大的新功能。打开项目,点击「上传剧本」,支持TXT、DOCX、PDF、Markdown四种格式,拖拽上传,最大 20MB。

上传后,AI 自动执行四个步骤:

Step 1-2:文本解析 + 角色提取

AI 从全文中提取所有角色,统计出现频次,自动判断主角/配角。每个角色生成电影级视觉描述——体态、面部、发型、服装、武器、色彩调色板,直接可用于 AI 图像生成。角色卡片支持切换主角/配角身份。

Step 3:智能分集

AI 根据故事结构自动拆分为多集,每集生成标题、描述、关键词和详细创意构思,并展示该集出场角色。分集结果可编辑标题、删除不需要的集。

Step 4:一键创建

批量创建所有分集和角色,自动建立角色-分集关联关系。全流程日志记录,随时回看历史导入过程。


二、提示词管理系统:精细控制 AI 的每一个环节(v0.2.1)

这是 v0.2.1 的核心更新。AI Comic Builder 的生成流水线涉及 12 个不同的 AI 提示词(剧本生成、角色提取、分镜拆分、画面描述、视频提示词……),之前这些提示词硬编码在代码中,用户无法调整。

现在,每一个提示词都可以自定义

12 个提示词插槽

系统将所有 AI 提示词分为 5 大类:

类别提示词用途
剧本script_generate / script_parse / script_split生成剧本、解析结构、智能分集
角色character_extract / import_character_extract / character_image角色提取、视觉描述、四视图生成
分镜shot_split剧本拆分为单个镜头
画面frame_generate_first / frame_generate_last / scene_frame_generate首帧/尾帧/场景参考帧生成
视频video_generate / ref_video_prompt_generate视频提示词生成

每个提示词被拆解为多个可编辑插槽(Slot),比如script_generate包含role_definition(角色定义)、language_rules(语言规则)、output_format(输出格式)、visual_style_section(视觉风格)等 7 个插槽。你可以只修改其中一个,其余保持默认。

三级优先级解析

项目级覆盖 > 全局级覆盖 > 代码默认值
  • 全局提示词:在设置页面统一管理,对所有项目生效
  • 项目提示词:在项目内单独覆盖,只影响当前项目
  • 代码默认:内置的精调提示词,开箱即用

两种编辑模式

  • 插槽模式:逐个修改每个插槽的内容,适合微调
  • 高级模式:直接编写完整提示词全文,适合深度定制

版本历史 & 预设

  • 每次修改自动记录版本,支持一键回滚到任意历史版本
  • 支持保存为预设模板,方便在不同项目间复用
  • 实时预览功能,修改后立即查看最终解析结果

导航入口

全局导航栏新增提示词管理图标,一键进入全局提示词设置页。项目内也有独立的提示词管理入口。


三、Veo 模型全系列适配(v0.2.2)

Google Veo 是目前最强大的视频生成模型之一。v0.2.2 实现了Veo 2.0 / 3.0 / 3.1的全系列适配。

三种生成模式

模式输入说明
关键帧模式首帧 + 尾帧(可选)标准 image-to-video,Veo 3.1+ 支持双帧
参考图模式场景参考图以参考图为基础生成视频
角色参考模式角色参考图 + 场景帧Veo 3.1+ 独占,最多 3 张参考图

版本差异自动适配

  • Veo 2.0:支持首帧 + 尾帧,时长 4/6/8 秒自动匹配
  • Veo 3.0:仅支持首帧(尾帧自动禁用)
  • Veo 3.1+:完整支持所有模式,包括角色参考图

系统自动检测模型版本,智能选择最佳生成策略。异步轮询处理长时间生成任务(最长 10 分钟),安全过滤器检测与错误报告。


四、AI 一键优化:让每段描述都更专业(v0.2.2)

分镜编辑器中的每个文本字段现在都有一个 ✨ 按钮——AI 优化

点击后弹出对话框,可以添加自定义优化指令。AI 会根据字段类型使用不同的优化策略:

字段优化方向
场景描述补充电影级细节——灯光类型、色彩分级、空间层次、氛围渲染
首帧描述明确构图——取景框架、三分法、灯光、机位角度
尾帧描述强调与首帧的动态对比——位置变化、表情、灯光、构图转换
运动脚本规范为分段格式(“0-2s: … 2-4s: …”),四层描述(肢体、环境、镜头、氛围)
视频提示词精炼为 40-70 字散文体,精准的物理运动描述(方向、速度、距离)

AI 自动保持原文语言(中文→中文,英文→英文),只输出优化后的文本。


五、分集连续生成 & 视频合并(v0.2.1)

分集衔接

在分镜生成时勾选「接续上一集」,系统会自动:

  1. 查找上一集的最后一个镜头
  2. 提取上一集的尾帧画面
  3. 将其复制为当前集的首帧

这样相邻两集在视觉上无缝衔接,不会出现画风断裂。

视频合并

分集列表新增「合并视频」模式:

  1. 点击「合并视频」进入多选模式
  2. 勾选 2 个以上已生成视频的分集
  3. 点击「合并选中」
  4. FFmpeg 按分集顺序自动拼接
  5. 预览合并结果,支持下载

六、更多改进

剧本自动保存

编辑剧本时不再需要手动保存。文本编辑后1.5 秒自动存储,切出编辑器时也会触发保存。

项目级角色管理

主角和配角分区展示,每个角色卡片支持编辑、生成四视图、删除。角色在项目内共享,跨集复用。

生成流水线深度优化

  • 分镜生成:按 SCENE 标记自动拆分,并发调用 AI,解决长剧本 JSON 截断问题
  • 视频提示词:同时传入首帧和尾帧,AI 能精准描述过渡动作
  • 角色一致性:Gemini 生成画面时参考图标注角色名,强制服装一致
  • 批量并发:30 个 shot 同时生成提示词,速度大幅提升
  • 角色隔离:统一使用episode_characters关联表,只查本集角色

Markdown 文件导入

导入 Pipeline 新增.md/.markdown格式支持,方便直接导入 Markdown 格式的剧本或大纲。


技术架构亮点

系统技术方案
提示词存储prompt_templates+prompt_versions+prompt_presets三表
提示词解析三级优先级(项目 > 全局 > 默认),插槽级别粒度
状态管理Zustand store,脏检测 + 自动保存
Veo 适配Google GenAI SDK,版本自动检测,异步轮询
视频合并FFmpeg 命令行调用,按分集顺序拼接
分集衔接文件级帧复制,ULID 命名避免冲突
国际化全部 UI 文本使用 next-intl,支持中/英/日/韩

升级方式

gitpullpnpminstallpnpmdev

数据库迁移在启动时自动执行。

Docker 用户:

dockerpull twwch/aicomicbuilder:latestdockercompose up-d

下一步计划

  • 分集内角色解析后自动关联
  • 导入 Pipeline 支持断点续传
  • 更多视频模型适配(Sora、Runway)
  • 音频/配音集成

AI Comic Builder是一个开源项目,欢迎 Star 和贡献:

GitHub: https://github.com/twwch/AIComicBuilder

http://www.jsqmd.com/news/572730/

相关文章:

  • HsMod:55项功能全面提升炉石传说游戏体验的开源插件
  • 破乳剂的作用原理:污水处理中油水分离的核心
  • 苗木采购新选择:2026年靠谱厂家大盘点,苗木采购/园林养护/景观工程/绿化服务/苗木供应/绿化工程,苗木采购公司有哪些 - 品牌推荐师
  • 如何高效处理大量图片尺寸?PowerToys Image Resizer的批量解决方案
  • 对俄出口标签合规:CRPT 诚实标签采集关联系统的软硬件一体化技术架构实现背景与行业痛点
  • 数据自主权破局:WeChatMsg重构微信聊天记录管理新范式
  • AI给出的消费决策答案正在重构所有行业的生意逻辑
  • 告别JNI与Unsafe:JDK内存API实战指南
  • 2026年全网营销GEO优化公司客观测评:艾奇GEO等五家机构选型指南 - 小白条111
  • React 中基于 Axios 的二次封装(含请求守卫)
  • P8340 [AHOI2022] 山河重整
  • 效率飞跃:用快马ai定制openclaw多场景开发环境模板
  • Web前端安全核心知识总结
  • 别再傻傻分不清!Android Studio里androidTest和test文件夹到底怎么用?(附实战代码对比)
  • 解锁高效链接的专业领域
  • 微信立减金回收(方法、流程、折扣) - 京顺回收
  • 忍者像素绘卷效果展示:高对比度线条+32色调色板生成的复古游戏风插画
  • EasyHTTP:ESP32轻量级HTTP客户端库设计与实践
  • PostGIS数据库配置与gdb数据高效导入实战
  • 3个强力步骤!开源工具G-Helper实现华硕笔记本电池续航优化解决方案
  • 2026年 五轴车铣复合加工中心厂家实力推荐榜:高精度、高效率、高稳定性的智能智造解决方案首选 - 品牌企业推荐师(官方)
  • 同样是加热,为什么夹爪热传导更适合空心杯电机?
  • 2026年口碑营销GEO优化服务商真实测评:艾奇GEO等三家选型指南 - 小白条111
  • 新手零门槛学数据库:在快马平台完成你的第一个SQL查询
  • 蛋白共表达技术详解:从多基因构建到蛋白复合体研究的核心工具
  • D3KeyHelper智能辅助工具:暗黑3效率提升全流程攻略
  • 20260326网安学习日志—文件上传漏洞
  • Phi-4-mini-reasoning Chainlit定制化教程:添加LaTeX渲染与公式高亮
  • 如何用MelonLoader打造Unity游戏定制体验:双引擎支持的模组加载方案
  • 实测Qwen3-Reranker-0.6B:轻量级模型如何重塑企业RAG系统?