当前位置: 首页 > news >正文

扣子(Coze)实战:65个作品涨粉100W!Nano Banana+Grok一键生成科学探秘视频

大家好,我是吾鳴。专注于分享提升工作与生活效率的工具,无偿分享AI领域相关的精选报告,持续关注AI的前沿动向。

关于科幻类题材的视频,可谓是毫无抵抗力,比如像三体,埃及金字塔如何建成的,百慕大三角消失100年的船只突然出现等。

这类题材的视频,是自带流量的,因此它们本身就是非常有名的事件,只是有些原因人们可能还未弄清楚,所以就是那个“迷”,让许多人都想知道到底是为什么。

有人就捉住了这一波自带流量的未解之谜事件,然后把它做成了解说视频,搭配上视频画面,在某音上可谓是大杀四方,仅仅65个作品,就涨粉近100W。

经过对这个号的多条视频拆解,发现可以使用扣子工作流来制作,因为视频中的画面质感都很好,所以本文分享的工作流将采用Nano Banana 2来进行分镜图片的生成,视频生成部分是使用XAI公司推出的视频生成模型Grok来生成。

在进行工作流讲解之前,我们先来看看效果,比如我输入的科学主题是“地球演化史——恐龙灭绝的讲解”,配上一段背景音乐,一会儿功夫,一条视频就生成了。

地球演化史——恐龙灭绝的讲解

因为本文分享的工作流较为复杂,因此我不会对每一个节点都做讲解,对扣子剪辑视频感兴趣的朋友可以看看我之前对每天听懂一首歌这个案例的拆解。

1. 完整的工作流程

工作流我把它拆解成了三大部分,分别是【科学探秘解说语音和字幕】、【科学探秘分镜视频】和【剪映草稿】,下面的章节中会对这几部分的作用展开介绍,并且对一些关键的节点进行讲解。

2. 科学探秘解说语音和字幕

这部分节点的作用是用来产出科学探秘视频的解说语音时间线和解说字幕的时间线。

主要是使用到了扣子官方的大模型节点、语音合成插件,大模型节点用来生成视频解说的文案,语音合成插件则是把生成的文案转成语音。

还有三方的插件【视频剪辑工具箱】的multi_audio_timeline、multi_caption_timeline工具,分别用来生成剪映的音频时间线和字幕时间线。

2.1. 开始

  • subject:科学主题,必填
  • bgm:背景音乐文件,必填
  • api_token:插件认证,可后台联系获取(有条件),必填

2.2. 科学探秘科普文案生成

这个节点的作用是用来生成科学探秘的科普文案,使用到了扣子官方的大模型节点,需要注意的是,因为怕大模型会不懂输入的科学主题,所以添加了一个联网搜索的技能,让它在不懂的时候,不要一本正经胡说八道,而是去网上找资料再来回答。

受限文章篇幅,系统提示词已经打包好,放到了文末,感兴趣的朋友可到文末获取。

3. 科学探秘分镜视频

这部分的节点主要是用来生成科学探秘视频分镜的时间线,主要的处理思路是先把散乱的文案合并成语音情感完整的小段落,然后再根据段落来生成分镜的绘图提示词和视频提示词,进而通过大模型来生成分镜的视频。

主要使用到了扣子官方的大模型节点,用来合并散乱的字幕,生成分镜的绘图提示词和视频提示词。

用到了三方的插件【AI绘图工具箱】的gen_naba2_image_sync工具来调用Nano Banana 2的接口来生成图片,生视频是使用到了【AI视频生成工具箱】的gen_grk_video_sync工具来调用Grok的接口来生成视频。

3.1. 科普解说字幕文案合并

这个节点使用到了扣子官方的大模型节点,用来合并散乱的字幕,形成语义连贯的小段落。受限文章篇幅,系统提示词已放到了文末,感兴趣的朋友可以按照文末的方式获取。

3.2. 绘图&视频提示词生成

这个节点用来生成分镜的绘图提示词和视频提示词,使用到了扣子官方的大模型节点,受限于文章的篇幅,系统提示词已经打包放于文末,感兴趣的朋友可以按照文末的方式获取。

3.3. Nano Banana 2生图

这个节点用来生成分镜图片,使用到了扣子三方插件【AI绘图工具箱】的gen_naba2_image_sync工具,用来对接Nano Banana 2生图。

3.4. Grok生成视频

这个节点使用到了扣子三方插件【AI视频生成工具箱】的gen_grk_video_sync工具,用来对接Grok模型来生成分镜视频。

4. 剪映草稿

这部分的节点用来把前面生成好的解说语音时间线、字幕时间线、分镜视频时间线等添加到剪映草稿中,主要使用到了扣子三方插件【视频剪辑工具箱】的以下工具。

create_draft:创建剪映草稿

add_audios:添加音频时间线到剪映草稿

add_captions:添加字幕时间线到剪映草稿

add_videos:添加视频时间线到剪映草稿

save_draft:保存剪映草稿

5. 写到最后

Nano Banana 出图的效果很赞这个已经是公认的了,遥遥领先,Grok这个模型的生视频能力也惊艳到我了,画质不错,里面的角色的动作也是很流畅的,不会显得很死板。

本文的分享就到这里,如果您觉得有收获的话,可以给个一键三连,您的鼓励是吾鳴持续输出的最大动力。

对本文分享的工作流感兴趣的朋友,欢迎后台交流。

http://www.jsqmd.com/news/588326/

相关文章:

  • Go 协程调度与系统线程映射
  • 13、探索transforms.RandomRotation()在图像增强中的灵活应用
  • 从“炼金术”到“建筑学”:深度学习结构设计的五大范式
  • 从展台到策略执行:WEEX 在 NBX2026 展示 AI 真实应用场景
  • D2-实验三:k8s Nginx 部署实验,目的学习命名空间ns的创建与管理
  • 基于STM32的保温水壶控制器设计
  • CSDN程序员副业图谱技术文章推荐
  • 不用微信体系的企业IM推荐(附优缺点分析)
  • 汽车充电桩
  • 大模型的部署简介
  • Qwen2.5-VL-7B-Instruct快速部署:纯本地无网络依赖,一键启动视觉助手
  • ELF-RV1126B 实验05B:RKNN 模型加载与运行时初始化验证
  • 有限长度直导线的三维磁场计算:应用毕奥-萨法尔定律附Matlab代码
  • 从相亲决策到机器学习:3000字讲透决策树算法
  • 标题:软黄土改良用水泥搅拌桩的碳排放评估及白泥-水泥复合材料的碳减排研究
  • 一种风速测量仪的设计与制作
  • layout中节点不显示,也没解决,就是记录一下。
  • C++的std--ranges子范围概念与迭代器对在算法约束中的精确表达
  • 湖南长沙正规的空调工厂名声
  • 2025 直播电商行业发展白皮书解读:规模、生态与规范化趋势
  • Dart 堆栈符号化
  • 架桥记:耐达讯自动化CC-Link IE转EtherCAT的工业协议融合实战
  • 2026年新闻发稿高性价比服务商选型指南:行业趋势、适配标准与主流平台分析 - 发稿平台推荐
  • Windows平台MSVC编译的FFmpeg库
  • 植物大战僵尸游戏辅助工具:解锁9大隐藏功能提升玩家效率的完整指南
  • YOLO12保姆级教程:2025最新目标检测模型,5分钟开箱即用
  • 零基础学唱歌全套教程 声乐技巧入门到进阶资源
  • 1111111111111111111111
  • 飞书项目 vs. PowerProject:复杂软件研发场景深度对比评测
  • Bert模型