当前位置: 首页 > news >正文

4.8K Star!本地语音转文字神器Vibe:基于Whisper离线转录,支持GPU加速+字幕导出

一直想找个离线的语音转文字工具,网上那些在线服务要么收费,要么担心隐私泄露,最近发现了Vibe这个开源项目,完全离线使用OpenAI Whisper模型转录,支持几乎所有语言,还能导出SRT字幕、翻译成英文、批量处理文件,GPU加速后速度飞快,用了几周感觉太好用了,视频字幕制作必备


Vibe是什么

它是一个基于OpenAI Whisper的桌面应用,能完全离线进行语音转文字,支持音频视频转录、从YouTube等网站直接转录、批量处理、字幕导出等功能,内置GPU加速(支持Nvidia/AMD/Intel),还能用Claude API做摘要或本地Ollama分析,完全免费开源

开源成就

  • • Star数 已经收获4.8K Star,离线转录工具首选

  • • 主开发语言 用Rust+TypeScript开发,基于Tauri框架

核心功能

  • 完全离线转录,所有处理都在本地进行,数据绝不上传,隐私安全有保障

  • 多语言支持,基于Whisper模型支持几乎所有语言的转录,准确率很高

  • 多格式导出,支持SRT、VTT、TXT、HTML、PDF、JSON、DOCX等格式

  • 在线媒体转录,可以直接转录YouTube、Vimeo、Facebook等网站的音视频

  • 批量处理,一次处理多个文件,大幅提高效率

  • GPU加速,支持Nvidia、AMD、Intel显卡(Vulkan/CoreML),速度飞快

  • 实时预览,转录过程中实时查看结果

  • AI摘要功能,用Claude API快速生成多语言摘要,或用本地Ollama批量分析

  • 翻译功能,可以将任何语言翻译成英文

  • 说话人分离,自动识别不同说话人

安装指南

  • 官网下载,支持多平台

# 访问官网下载对应系统版本 https://thewh1teagle.github.io/vibe/ # 支持平台 - macOS - Windows - Linux
  • 基本使用

1. 打开Vibe应用 2. 拖拽音频/视频文件到窗口 3. 选择语言(可选) 4. 点击开始转录 5. 导出字幕文件
  • 在线媒体转录,直接处理网页视频

1. 复制YouTube等网站的视频链接 2. 在Vibe中粘贴链接 3. 应用会自动下载并转录 4. 支持YouTube、Vimeo、Facebook、Twitter等
  • 批量处理,一次搞定多个文件

1. 拖拽多个音视频文件到Vibe 2. 选择统一的输出格式 3. 点击批量转录 4. 自动依次处理所有文件
  • GPU加速设置

# 在设置中启用GPU加速 - Nvidia显卡: 自动使用CUDA/Vulkan - AMD显卡: 使用Vulkan加速 - Intel显卡: 使用Vulkan加速 - macOS: 使用CoreML加速 # GPU加速可以提升3-5倍转录速度
  • 自定义模型

# 在设置中可以选择不同大小的Whisper模型 - tiny: 最快,准确度较低 - base: 平衡速度和准确度 - small: 推荐日常使用 - medium: 高准确度 - large: 最高准确度,速度较慢 # 还可以通过URL集成自定义模型 vibe://download/?url=<model_url>
  • 字幕时长优化,适配不同场景

# 针对视频/短视频优化字幕长度 - 标准视频模式: 适合电影、纪录片 - 短视频模式: 适合抖音、快手等竖屏视频
  • CLI命令行使用,自动化处理

# 通过命令行使用Vibe vibe --help # 批量转录文件夹中的所有音视频 vibe transcribe /path/to/folder/*.mp4 # 启动HTTP API服务器 vibe --server # 访问Swagger文档 http://localhost:3022/docs
  • HTTP API功能

# 启动API服务 vibe --server # 使用API进行转录 curl -X POST http://localhost:3022/transcribe \ -F "file=@audio.mp3" \ -F "language=zh" # 查看API文档 http://localhost:3022/docs
  • 录音转录

# 系统音频录制转录 1. 选择"系统音频"选项 2. 开始录制 3. 停止后自动转录 # 麦克风录音转录 1. 选择"麦克风"选项 2. 开始录音 3. 实时转录显示
  • AI增强功能

# Claude API摘要 1. 在设置中配置Claude API Key 2. 转录完成后点击"摘要" 3. 快速生成多语言摘要 # Ollama本地分析 1. 安装Ollama并运行 2. 在Vibe中连接Ollama 3. 批量分析转录内容

开源地址 https://github.com/thewh1teagle/vibe

http://www.jsqmd.com/news/156335/

相关文章:

  • 终极指南:掌握XUnity.AutoTranslator实现Unity游戏自动化翻译
  • XUnity.AutoTranslator深度解析:解决游戏文本翻译失效的终极指南
  • Matlab综合能源系统优化代码 考虑光热电站(CSP电站)和ORC的综合能源系统优化的建模求解
  • [AI] openwebui内网部署网页加载缓慢?一个设置绕过openai连接问题!
  • 一文说清自动驾驶车载计算平台的分层结构
  • [AI] 本地部署 Dify 遇到 Internal Error?一文彻底解决密码不一致引发的问题
  • 锂电设备切卷机的欧姆龙PLC与威纶通触摸屏程序解析
  • PyTorch-CUDA-v2.6镜像安装教程:GPU加速深度学习的终极指南
  • 终极指南:3步解决游戏翻译路径问题
  • 嵌入式毕设容易的任务书推荐
  • GHelper三大突破:告别臃肿控制软件,重获ROG笔记本性能自由
  • 电话号码定位技术:3步实现精准位置查询的完整指南
  • [AI Agent] 如何在本地部署 Aider 并接入局域网 Ollama 模型,实现本地智能助手操作系统资源
  • 新手快速上手Packet Tracer:五步完成简单网络搭建
  • 目标代码形式主要包括三种:汇编语言形式、绝对机器指令代码和可再定位机器代码
  • 从零实现工业网关的Vivado程序烧录方案
  • XUnity.AutoTranslator:游戏文本自动翻译的完整指南
  • 人类基准测试大翻车:样本不足、方法不透明,AI性能结论可信吗?
  • XUnity.AutoTranslator:Unity游戏本地化的终极解决方案
  • [DevOps] 【Dify】彻底解决 Dify 部署中 Docker Desktop 反复重启的问题
  • 零基础实现手机调光调色LED灯项目指南
  • XUnity.AutoTranslator终极指南:5分钟掌握Unity游戏自动化翻译
  • 程序的组成可以分为两个主要部分:**分析部分**和**解释部分**,它们共同完成对源程序的解析与执行
  • PyTorch模型保存与加载的最佳实践(.pt/.pth格式)
  • XUnity.AutoTranslator 3步搞定游戏翻译:从菜鸟到高手的实战指南
  • XUnity.AutoTranslator游戏翻译失效的3步诊断与修复指南
  • HMI变量绑定示例
  • 虚拟手柄驱动完整技术解析:从内核级模拟到实战应用
  • SSH端口转发访问远程PyTorch Web服务
  • 从零搭建大模型推理平台:PyTorch + CUDA + Token计费系统