当前位置: 首页 > news >正文

告别抽卡式AI视频,这个开源项目让剧本一键变成片!

你有没有试过:熬夜写完3000字剧本,想用AI生成视频,结果男主角每帧换一张脸,前一秒在咖啡厅、下一秒跳到火星,连戏?不存在的。反复抽卡100次,只能含泪发朋友圈:"AI虽好,可惜不听话。"

我也被这个问题折磨了很久。所以花了几个月时间,做了一个完全开源的项目,分享给大家——


BigBanana AI Director(AI 短剧/漫剧工场)

GitHub:https://github.com/shuyu-labs/BigBanana-AI-Director

一句话概括:把你的故事文本变成可控的视频成片,全程不掉链子。

它不是让AI随机"抽卡"出画面,而是模拟真实影视制作流程——先定妆、再搭景、然后画分镜、最后合成片。每个环节你都能干预,每帧画面都受约束,告别"薛定谔的男主角"。

完全开源,免费使用,代码随便看。希望能帮到同样在折腾AI视频的朋友们。

项目管理

它能做什么?

🎬 功能一:智能剧本拆解

场景:你有一篇5000字的小说片段,想做成3分钟短剧。

效果:粘贴进去,AI自动拆成"场景→镜头→台词"的标准分镜表,还能设定目标时长,它帮你规划节奏密度。不用手动分段,省下2小时。

剧本创作

🎭 功能二:角色定妆 + 衣橱系统

场景:男主要有"日常装"和"战斗装"两套造型,但脸不能变。

效果:先生成一张"定妆照"作为基准,再基于它生成不同服装变体。所有后续画面都参考这张脸,彻底锁死五官,换衣服不换人。

角色场景

🖼️ 功能三:关键帧驱动的视频生成

场景:你要一个"男主回头"的镜头,普通AI随便动动就糊弄你。

效果:先画起始帧(正面)和结束帧(回头状态),再让Veo模型在两帧之间"补间"出丝滑动画。起点终点你说了算,过程AI帮你填。

导演工作台

📦 功能四:一键导出 + 渲染追踪

场景:生成了20个镜头,想批量导出去Premiere剪辑。

效果:时间轴预览全部片段,一键导出高清关键帧和MP4视频,还能实时看渲染进度。专业后期无缝衔接。

成片导出

✏️ 功能五:全流程手动微调

场景:AI生成的分镜提示词有点跑偏,想手动改几个词。

效果:每个分镜的角色列表、动作描述、画面提示词都能直接编辑。AI打底,人类精修,控制权始终在你手里。

镜头与帧

技术架构一览

整体架构可以简化为三层:

┌─────────────────────────────────────────────────┐ │ 输入层:剧本/故事文本 │ │ ↓ GPT-5.1 智能拆解 │ ├─────────────────────────────────────────────────┤ │ 资产层:角色定妆照 + 场景概念图 │ │ ↓ Gemini 3 Pro 约束生成 │ ├─────────────────────────────────────────────────┤ │ 输出层:关键帧 → Veo/Sora 视频插值 → MP4成片 │ └─────────────────────────────────────────────────┘

设计巧思

  • "约束优先"而非"随机生成":每帧画面都必须参考角色图和场景图,杜绝AI自由发挥

  • 纯前端架构:React 19 + IndexedDB 本地存储,数据不离开你的浏览器,隐私无忧

  • 统一API调度:通过AntSK接口一站式调用文本/图像/视频模型,不用切换多个平台


3步快速上手

步骤

操作

时间

访问项目,配置API Key

1分钟

粘贴故事 → 点击"生成分镜脚本"

30秒

进入导演台 → 批量生成关键帧和视频

按需

代码仓库:https://github.com/shuyu-labs/BigBanana-AI-Director
在线体验:https://bigbanana.tree456.com/
API获取:https://api.antsk.cn/ (新用户有免费额度)


为什么开源?

做这个项目的初衷很简单:让没有影视制作经验的人,也能把脑子里的故事变成视频。

AI视频这个领域变化太快,一个人闭门造车肯定跟不上。开源出来,大家一起迭代,才能做得更好。

接下来计划做的功能:

  • 🔊 AI配音与口型同步

  • 🎵 BGM智能匹配

  • 📱 移动端适配

欢迎提Issue、提PR,或者单纯来聊聊你的想法。


📱 加入微信交流群

我建了一个AI漫剧创作交流群,群里有:

  • 第一时间的功能更新通知

  • 遇到问题可以直接问我

  • 和其他创作者交流经验、分享作品

  • 不定期分享AI视频创作技巧

扫码加群,一起交流:

微信群二维码

最后

👀 先看看
点击「阅读原文」访问GitHub仓库,代码、文档、演示全都有

⭐ 觉得有用?
给项目点个Star,也欢迎分享给有需要的朋友

🚀 动手试试
在线体验:https://bigbanana.tree456.com/

有任何问题,群里见!


#AI视频#开源项目#AIGC#短剧制作#效率工具

http://www.jsqmd.com/news/338532/

相关文章:

  • 2026年旧衣物开花机设备推荐:济南鑫金龙机械,纤维/废布/废棉/化纤块开花机全系供应 - 品牌推荐官
  • 2026年高空安全防护设备推荐:加安和诺垂直/水平生命线系统及装置全解析 - 品牌推荐官
  • 基于SpringCloud的分布式演唱会抢票系统(源码+lw+部署文档+讲解等)
  • 三步快速摸清陌生研究领域,轻松搞定文献调研
  • Qoder 上线首个定制模型,5个月完成“模型-智能体-产品”全形态布局
  • 国产化备份“山河图”
  • MPI 广播一个数组代码示例
  • 一份来自40000+次真机评测的具身智能年度报告!RoboChallenge打破Demo滤镜:最强模型也只有51%成功率
  • Maven踩坑指南:依赖冲突专治不服,范围聚合玩明白!
  • 重庆集训比赛记录
  • 2026年老旧电梯维保优质厂家推荐榜:济南电梯保养、济南电梯改造、济南电梯更新、济南电梯维修、电梯保养、电梯更新选择指南 - 优质品牌商家
  • Servlet入门保姆级教程:从0到1搞定Tomcat与Web开发
  • 调查:超1/4游戏开发者近两年遭解雇,近一半仍未找到新工作;阿里自研AI芯片“真武”亮相;华为手机全系降价,最高达4000元 | 极客头条
  • 编程门槛被压到799美元?“那个拿着Mac Mini+Claude的「门外汉」,抢走了程序员3个月的活!”
  • 九江濂溪区桶装水配送 - 中媒介
  • DeepMind的PYSC2环境——报错:pygame.error: Unable to make GL context current
  • 进口金库门哪里买 - 中媒介
  • 饲料烘干机、中药材干燥机、中药材烘干机、农业干燥机、化工原料烘干机、化工干燥机、四川干燥机厂家、四川烘干机厂家选择指南 - 优质品牌商家
  • 我的常用软件
  • 2026年锂电池厂家权威推荐榜:户外太阳能路灯、新农村太阳能路灯、老年车锂电池、货三轮锂电池、道路太阳能路灯、高杆太阳能路灯选择指南 - 优质品牌商家
  • 金库安全屋适合别墅安装吗? - 中媒介
  • 网上课程学习系统毕业论文+PPT(附源代码+演示视频)
  • 三合安防金库门技术优势(ECB-S V级认证) - 中媒介
  • 基于Android的大学生食堂点餐平台的设计与实现(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码
  • 基于SpringBoot和Vue的物联网仓储管理系统(源码+lw+部署文档+讲解等)
  • 隐形金库门与传统金库门安全性对比 - 中媒介
  • [深度强化学习算法进阶项目】[源代码+论文】(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码
  • 2026市政亮化太阳能路灯锂电池优质厂家推荐 - 优质品牌商家
  • 基于SpringBoot和Vue的物流管理系统(源码+lw+部署文档+讲解等)
  • python2025旅游推荐系统+爬虫+可视化(协同过滤算法)(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码