一、基础产品类关键词
- 剪映 / CapCut剪映为国内中文客户端名称,CapCut 是海外国际版名称,字节自研一站式 AI 剪辑工具,覆盖手机、Windows、macOS 多端,原生适配短视频生态,二者账号、素材、会员体系不互通。
- 多端云端同步依托字节云存储,剪辑草稿、收藏模板、自定义预设跨手机 / 电脑互通,工程文件在线保存,可随时接力剪辑。
- 图文成片剪映核心图文生视频功能,输入文字脚本 + 自定义图片,AI 自动拆分分镜、生成画面动态、配音、字幕、转场,是图文转短视频核心入口。
- 一键成片批量导入照片、短视频素材,AI 自动匹配音乐卡点、运镜、特效、字幕,快速生成多版本成片,多用于照片合集。
- 剪同款模板复用功能,直接套用平台热门视频模板,仅替换图文素材即可复刻成片,降低创作成本。
- SVIP 会员付费权益体系,解锁 4K 导出、高级抠像、商用数字人、独家音效特效、无限制 AI 画质修复等高阶能力,免费版仅开放基础剪辑功能。
二、基础剪辑时间线术语
- 轨道时间线分层载体,分为视频轨道、画中画轨道、音频轨道、文本轨道、贴纸轨道,多层轨道叠加实现复合画面效果。
- 画中画多层视频 / 图片叠加技术,在主画面之上新增独立素材轨道,配合蒙版、关键帧实现分屏、弹窗、悬浮图文效果。
- 关键帧动画控制核心技术,对素材位置、大小、透明度、滤镜强度、蒙版范围设置起点、终点参数,软件自动生成平滑连续动态运镜。
- 蒙版区域遮罩技术,包含线性、圆形、矩形、文字、钢笔自定义蒙版,遮挡画面局部、分离主体与背景,实现抠图、分屏、创意视觉效果。
- 色度抠图(绿幕抠像)识别纯色背景并透明化,常用于数字人、虚拟场景合成,属于实时图像分割技术。
- 画布视频基底画幅设置,支持 9:16 竖屏、16:9 横屏、1:1 方形、2.35 电影宽幅,画布填充包含模糊、纯色、图片背景三种模式。
- 曲线变速非线性变速技术,自由设定片段不同区间快慢放,搭配光流补帧消除慢动作卡顿,适配卡点、氛围感镜头。
- 光流补帧AI 插帧算法,低速镜头自动生成中间过渡帧,解决慢动作画面卡顿、拖影问题,提升画面流畅度。
- 多机位剪辑多段同场景素材自动对齐音频波形,快速切换镜头,适合直播切片、活动多镜头素材剪辑。
三、AI 图文生视频核心技术术语
- 语义分镜拆解图文成片底层 NLP 自然语言技术,AI 解析文案语义、段落逻辑,自动拆分独立分镜单元,匹配对应画面内容。
- 图像微动运镜对静态图片做局部动态渲染,自动生成推、拉、摇、环绕镜头运动,补充帧间动态,让静态图文具备视频流动感。
- 文生图辅助填充内置文生图大模型,当自有图片素材不足时,根据文案关键词自动生成匹配画面,补齐分镜空缺。
- 主体锁定图生视频约束算法,上传自定义产品、人物参考图后,锁定主体外形特征,避免 AI 动态渲染时人物、物体畸变、变形。
- 帧间插值静态图转动态视频基础算法,基于单张原图生成连续多帧画面,实现云层流动、水流、物体轻微位移等自然动态效果。
四、音频 AI 技术术语
- 人声分离音频频谱分割算法,自动分离视频中人声、背景音乐、环境噪音,分离后可单独编辑人声轨道。
- AI 降噪频域降噪模型,过滤室内底噪、风声、电流杂音,保留清晰人声,无需专业收音设备。
- 文本朗读 TTS语音合成技术,输入文字生成真人感配音,内置多音色、方言、外语声线,用于图文成片旁白。
- 音色克隆定制化 TTS 能力,上传少量真人语音样本,复刻专属声线朗读文案,多用于企业专属解说配音。
- 音量均衡自动归一化算法,统一全片人声、BGM、音效响度,避免片段忽大忽小。
- 智能卡点音频节拍识别模型,解析音乐鼓点、节奏,自动对齐图片切换、镜头转场、文字动画。
五、字幕与视觉 AI 技术术语
- 智能语音转字幕 ASR语音识别大模型,实时将人声转换文字字幕,支持普通话、多方言、英语,自动断句、分行、时间轴对齐。
- 口播词过滤ASR 后处理算法,自动识别并一键删除 “嗯、啊、然后” 等口语冗余语气词,精简字幕。
- AI 画质增强超分辨率修复算法,提升模糊素材清晰度,修复老旧视频划痕、模糊、低分辨率画面。
- AI 扩图图像生成延展算法,对原图边缘智能延展,适配不同画幅,补齐画面缺失区域。
- 智能人像抠像视觉分割大模型,无需绿幕,一键识别人体轮廓并分离背景,精准识别发丝、手部细节,会员专属功能。
- HSL/RGB 曲线调色专业图像调色工具,分别控制色相、饱和度、明度、红绿蓝三色通道,精细调整画面光影色彩,可保存自定义调色预设。
六、数字人相关技术术语
- AI 数字人生成式虚拟人物模型,输入图文脚本自动匹配唇形、肢体动作,同步生成口播视频,分为真人复刻数字人、通用虚拟形象。
- 唇形驱动音频驱动面部算法,根据 TTS 配音文字、发音节奏实时匹配数字人口型,消除口型对不上画面问题。
- 数字人图文联动图文成片 + 数字人组合工作流,图文素材作为背景,数字人在画面中同步讲解文案,是产品讲解、教学视频主流方案。
七、渲染导出技术术语
- 实时预览渲染软件轻量化即时渲染,剪辑过程中实时预览画面、音频、动画效果,无需完整导出。
- 码率控制导出参数,高码率保留更多画面细节,文件体积更大;低码率压缩体积,适合短视频平台分发。
- 编码格式 H.264/H.265视频压缩标准,剪映默认 H.264 通用兼容,H.265 同等画质下文件体积更小,支持 4K 输出。
- 帧率 24/30/60fps每秒画面帧数,24fps 电影质感,30fps 短视频通用,60fps 画面丝滑,多用于运动、产品展示视频。
- 批量导出多版本工程一次性渲染输出,适合电商批量制作多条图文带货短视频。
八、行业场景关键词
- 短视频二创依托剪映 AI 工具对原始图文、影视素材二次剪辑、重组,适配抖音、视频号分发。
- 图文带货短视频电商场景,商品静态图 + 产品文案通过图文成片自动生成种草宣传视频。
- 知识口播短片自媒体科普场景,纯文字脚本搭配配图,无真人出镜,依靠 TTS 配音 + 字幕完成内容输出。
- 数字人讲解片企业培训、产品宣传场景,图文素材为背景,数字人完成全程解说。
- PPT 转视频职场场景,PPT 导出图片后导入图文成片,自动生成汇报、课件动态短片。