当前位置：首页 > news >正文

AI-Youtube-Shorts-Generator：10分钟学会用AI自动生成爆款短视频

news 2026/4/9 10:32:24

AI-Youtube-Shorts-Generator：10分钟学会用AI自动生成爆款短视频

【免费下载链接】AI-Youtube-Shorts-GeneratorA python tool that uses GPT-4, FFmpeg, and OpenCV to automatically analyze videos, extract the most interesting sections, and crop them for an improved viewing experience.项目地址: https://gitcode.com/gh_mirrors/ai/AI-Youtube-Shorts-Generator

在当今短视频爆发的时代，如何快速从长视频中提取精华内容并制作成适合移动端观看的垂直短视频？AI-Youtube-Shorts-Generator 正是解决这一痛点的终极工具！这个基于Python的开源项目利用GPT-4、FFmpeg和OpenCV的强大组合，自动分析视频内容，智能提取最有趣的部分，并将其裁剪优化为适合TikTok、YouTube Shorts和Instagram Reels的9:16竖屏格式。

🚀 为什么选择AI自动短视频生成工具？

传统视频剪辑需要大量手动操作：观看完整视频、标记精彩片段、裁剪尺寸、添加字幕等。AI-Youtube-Shorts-Generator 彻底改变了这一流程，让AI帮你完成所有繁重工作。只需提供YouTube链接或本地视频文件，系统就会自动完成以下任务：

智能内容分析：使用GPT-4o-mini识别视频中最吸引人的2分钟片段
自动语音转文字：GPU加速的Whisper技术实现快速转录
智能裁剪算法：人脸检测与运动跟踪的完美结合
专业字幕添加：Franklin Gothic字体风格化字幕
批量处理支持：一次处理多个视频，提高工作效率

📦 快速安装指南

系统要求

Python 3.10+
FFmpeg（含开发头文件）
ImageMagick（用于字幕渲染）
OpenAI API密钥

一键安装步骤

git clone https://gitcode.com/gh_mirrors/ai/AI-Youtube-Shorts-Generator.git cd AI-Youtube-Shorts-Generator sudo apt install -y ffmpeg libavdevice-dev libavfilter-dev imagemagick pip install -r requirements.txt

创建.env文件并添加你的OpenAI API密钥：

OPENAI_API=your_openai_api_key_here

🎬 使用教程：3种简单方式生成短视频

方式一：交互式操作（最简单）

./run.sh

系统会提示输入YouTube视频链接，然后自动选择最佳分辨率并开始处理。

方式二：命令行直接处理

./run.sh "https://youtu.be/你的视频ID"

方式三：本地视频文件处理

./run.sh "/path/to/your/video.mp4"

🔧 核心技术模块解析

1. 视频下载与处理模块

项目使用Components/YoutubeDownloader.py处理YouTube视频下载，支持多种分辨率选择。下载完成后，系统会自动转换为MP4格式，确保兼容性。

2. AI智能内容选择

Components/LanguageTasks.py是项目的核心大脑，这里配置了GPT-4的提示词，定义了什么样的内容被认为是"有趣、有用、令人惊讶、有争议或发人深省"。你可以根据自己的需求调整选择标准。

3. 智能裁剪算法

Components/FaceCrop.py实现了两种裁剪策略：

人脸视频：静态人脸居中裁剪，避免抖动
屏幕录制：半宽显示，带平滑运动跟踪（每秒最多移动1次）

4. 专业字幕系统

Components/Subtitles.py负责添加美观的字幕，使用Franklin Gothic字体、蓝色文字和黑色轮廓，确保在任何背景下都清晰可见。

⚡ 高级功能与配置

批量处理多个视频

创建urls.txt文件，每行一个URL，然后运行：

xargs -a urls.txt -I{} ./run.sh --auto-approve {}

系统会自动处理所有视频，无需人工干预。

并发执行支持

./run.sh "https://youtu.be/VIDEO1" & ./run.sh "https://youtu.be/VIDEO2" & ./run.sh "/path/to/video3.mp4" &

每个实例都有唯一的会话ID，临时文件不会冲突。

自定义字幕样式

编辑Components/Subtitles.py：

第51行修改字体：font='Franklin-Gothic'
第47行调整字体大小：fontsize=80
第48行更改颜色：color='#2699ff'

🎯 输出文件与命名规范

生成的短视频采用标准化命名格式：{视频标题}_{会话ID}_short.mp4

例如：my-awesome-video_a1b2c3d4_short.mp4

简化标题：小写字母，空格替换为连字符
会话ID：8位唯一标识符，便于追踪
分辨率：保持原始视频高度（720p → 404x720, 1080p → 607x1080）

🔍 常见问题与解决方案

问题1：CUDA/GPU加速失败

export LD_LIBRARY_PATH=$(find $(pwd)/venv/lib/python3.10/site-packages/nvidia -name "lib" -type d | paste -sd ":" -)

run.sh脚本会自动处理这个问题。

问题2：字幕无法显示

检查ImageMagick安全策略：

grep 'pattern="@\*"' /etc/ImageMagick-6/policy.xml

应显示：rights="read|write"

问题3：人脸检测不准确

确保视频前30帧有清晰可见的人脸
对于屏幕录制，系统会自动启用运动跟踪
低分辨率视频可能需要调整检测参数

📊 性能优化建议

1. 调整AI选择标准

编辑Components/LanguageTasks.py第29行的提示词，根据你的内容类型优化选择标准。

2. 优化运动跟踪

修改Components/FaceCrop.py：

第93行：update_interval = int(fps)控制更新频率
第115行：平滑参数调整
第107行：运动阈值设置

3. 视频质量设置

调整Components/Subtitles.py：

第74行：比特率设置bitrate='3000k'
第73行：编码预设preset='medium'

🚀 开始你的AI短视频生成之旅

AI-Youtube-Shorts-Generator 为内容创作者、营销人员和视频编辑者提供了一个强大的自动化工具。无论是从长视频中提取精彩片段，还是为社交媒体平台准备垂直格式内容，这个工具都能大幅提升你的工作效率。

记住，成功的关键在于：

选择合适的视频源：内容质量决定最终效果
合理配置AI参数：根据你的目标受众调整选择标准
批量处理提高效率：利用自动化功能处理多个视频
定期更新依赖：保持工具的最佳性能

现在就开始使用AI-Youtube-Shorts-Generator，让你的视频内容创作进入自动化时代！🚀

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.jsqmd.com/news/598626/

Energized Protection 源码贡献者访谈：背后的故事与开发经验

WarcraftHelper：魔兽争霸III现代优化工具解决方案

Batocera.linux多平台支持揭秘：从树莓派到x86的架构适配

小程序商城开发全攻略！呱呱赞平台高效搭建 - 企业数字化改造和转型

计算机毕业设计：Python出行数据可视化分析平台 Django框架可视化数据大屏数据分析大数据机器学习深度学习（建议收藏）✅

【 RAG 检索增强】技术解析：向量数据库、Embedding、召回与幻觉抑制

语燕输入法YuyanIme社区贡献指南：如何参与开源输入法开发

终极指南：如何通过stanford-tensorflow-tutorials可视化损失函数，轻松理解模型训练误差变化

Nodezator Socket检测系统：为什么这是最人性化的节点连接体验

我实测6款AI论文写作工具，把AI率从65%降到了12% - 麟书学长

Qwen3.5-2B多场景：跨境电商商品图→多语言标题生成→合规性检测→广告文案优化

Obsidian-skills插件生态系统：第三方技能和工具推荐

构建与应用四维认知对话流形：对话几何的量化框架——对话的微分几何建模：四维流形构造、分形时间与认知动力学（通俗版）

如何在VMware中运行macOS：Unlocker工具的完整指南

”测试开发全日制学徒班7期第3天“-Linux常用命令之性能统计

【Transformer 技术解析】架构原理、核心组件与现代演进

2026 年餐饮外卖小程序选型：从费用、售后到避雷，5 款平台详细拆解 - 企业数字化改造和转型

【云藏山鹰代数信息系统】云藏山鹰逻辑学与云藏山鹰逻辑系统代码浅析

Qwen2.5 vs DeepSeek-V3对比：中文理解与GPU占用评测

Obsidian-Skills容器化部署指南：Docker集成最佳实践

TSMaster诊断模块之UDS自动化测试全流程解析

“OSD”在不同的专业领域有着完全不同的含义，最常见的是指电子设备上的屏幕菜单调节功能 (On-Screen Display)。

呱呱赞小程序平台百科介绍：稳定可靠的企业级SaaS品牌 - 企业数字化改造和转型

OpenClaw语音控制之GoogleAPI 集成实战教程

obsidian-skills与CI/CD集成：实现自动化测试和部署的完整指南

【多模态技术解析】图文对齐、CLIP、LLaVA 与跨模态嵌入

GME-Qwen2-VL-2B-Instruct一文详解：图文检索指令规范（query/image vector分离）

Pixel Couplet Gen惊艳效果：横批卷轴物理动效+按键下压反馈真实演示

使用不同 AI 大模型生成一杯装满的红酒的高脚杯挑战赛 All In One

Web Workers和Service Worker入门指南：让你的网页性能飞起来的10个技巧