当前位置: 首页 > news >正文

whisper语音转文字配置

Whisper CUDA (RTX 5060) 环境配置笔记

1. 环境安装指令

第一步:卸载旧版 Torch (确保无冲突)

Bash

pip uninstall torch torchvision torchaudio -y

第二步:安装支持 RTX 5060 (Blackwell 架构) 的 CUDA 12.8 版本

Bash

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128

第三步:安装核心组件

Bash

pip install faster-whisper whisper-ctranslate2

2. 实际使用指令

推荐转录命令 (生成带标点、无时间戳的连贯文本):

Bash

whisper-ctranslate2 "输入文件.m4a" --model large-v3 --language zh --output_format txt --initial_prompt "以下是转录内容,请确保语句连贯并正确使用中文标点符号。"

whisper-ctranslate2 “lesson 0415 32h.m4a” --model large-v3 --language zh --output_format txt --initial_prompt “以下是转录内容,请确保语句连贯并正确使用中文标点符号。”
whisper “lesson 0415 32h.m4a” --model large-v3 --language zh --output_format txt --initial_prompt “以下是转录内容,请确保语句连贯并正确使用中文标点符号。”

参数说明:

  • --model large-v3: 使用精度最高的模型。

  • --language zh: 强制识别为中文。

  • --output_format txt: 仅输出纯文本文件(不含时间戳)。

  • --initial_prompt: 通过引导语强制模型生成标点符号。

--beam_size 1:将束搜索宽度设为1,与原版 whisper 默认值一致,减少重复幻觉。

--vad_filter True:启用语音活动检测,自动跳过静音片段,避免无语音段产生幻觉。

--condition_on_previous_text False:禁止用前一段输出作为下一段的上下文,防止错误内容向后传播。

--word_timestamps True:启用词级时间戳,改善分句断点的准确性。

3. 脚本

transcribe.py

""" 快速语音转文字工具 (whisper-ctranslate2) 用法: python transcribe.py """importosimportsubprocess# ── 配置 ──MODEL="large-v3"OUTPUT_FORMAT="txt"LANG_OPTIONS={"1":{"code":"zh","label":"中文","extra_args":["--beam_size","1","--vad_filter","True","--initial_prompt","大家好,这是一段录音。我现在开始讲话了,请注意听。今天我们来讨论一下这个问题。如果内容中有一些English,比如app,或者数字10等,保持原词不需要翻译。",],},"2":{"code":"en","label":"English","extra_args":["--beam_size","1","--vad_filter","True",],},}AUDIO_EXTS={".mp3",".m4a",".wav",".flac",".ogg",".wma",".aac",".mp4",".mkv",".webm"}deflist_files():returnsorted(fforfinos.listdir(".")ifos.path.isfile(f)andos.path.splitext(f)[1].lower()inAUDIO_EXTS)defchoose_language():print(f"\n{'─'*50}")print(" 选择语言 / Select language")print(f"{'─'*50}\n")forkey,optinLANG_OPTIONS.items():print(f" [{key}]{opt['label']}")print(f"\n [0] 退出\n")try:choice=input("输入编号: ").strip()except(KeyboardInterrupt,EOFError):print()returnNoneifchoice=="0"orchoice=="":returnNoneifchoicenotinLANG_OPTIONS:print("编号无效。")returnNonereturnLANG_OPTIONS[choice]defchoose_file(files,lang):print(f"\n{'─'*50}")print(f" 模型:{MODEL}| 语言:{lang['label']}| 格式:{OUTPUT_FORMAT}")print(f"{'─'*50}\n")fori,finenumerate(files,1):size_mb=os.path.getsize(f)/(1024*1024)print(f" [{i}]{f}({size_mb:.1f}MB)")print(f"\n [0] 返回\n")try:choice=input("输入编号开始转录: ").strip()except(KeyboardInterrupt,EOFError):print()returnNoneifchoice=="0"orchoice=="":returnNonetry:idx=int(choice)-1ifidx<0oridx>=len(files):print("编号无效。")returnNoneexceptValueError:print("请输入数字。")returnNonereturnfiles[idx]defmain():lang=choose_language()ifnotlang:returnfiles=list_files()ifnotfiles:print("当前目录没有找到音视频文件。")returnselected=choose_file(files,lang)ifnotselected:returnprint(f"\n开始转录:{selected}\n")cmd=["whisper-ctranslate2",selected,"--model",MODEL,"--language",lang["code"],"--task","transcribe","--output_format",OUTPUT_FORMAT,*lang["extra_args"],]subprocess.run(cmd)if__name__=="__main__":main()
http://www.jsqmd.com/news/887703/

相关文章:

  • 告别玄学修蓝屏:用Windows事件查看器和可靠性监视器精准诊断‘PAGE_FAULT’错误
  • SPT-AKI Profile Editor终极指南:完全掌控你的离线塔科夫存档修改
  • Unity游戏资源提取实战指南:AssetStudio核心原理与免费提取教程
  • 2026年近期剖析:温州不错的GEO优化直销企业市场价值 - 2026年企业推荐榜
  • 手把手教你用CTSpine1K和OAI-ZIB数据集,快速搭建医学影像分析环境(附代码)
  • 2026年05月排污泵优选:这些供货商值得一看,户外泵房/光伏太阳能供水设备/潜水排污泵,排污泵制造企业哪家好 - 品牌推荐师
  • 当有限元遇上游戏引擎:用Unity重现Abaqus应力云图的完整流程
  • Unity真机帧率监控:解耦CPU/GPU/Present三帧率
  • C++中显示与隐式加载dll的使用与区别
  • 什么是吱吱OC|2026
  • Unity安卓构建72小时实战指南:从零到真机运行
  • 2026年全国瓷砖美缝剂主流品牌盘点与实测对比:屋顶防水材料、强力瓷砖背胶、强力瓷砖胶、新型防水材料、柔性瓷砖胶选择指南 - 优质品牌商家
  • SSH私钥权限600原理与Linux文件系统安全机制解析
  • 基于肠道菌群与机器学习的帕金森病早期诊断模型BDPM详解
  • Simulink仿真避坑指南:单相全桥逆变电路方波驱动相位设置(θ=30° vs 60°)对输出波形的影响深度对比
  • AssetStudio深度解析:Unity资源加载原理与故障排除实战
  • Unity安卓打包实战指南:从环境配置到APK生成全链路排错
  • 从测速到配置:一套完整的cFosSpeed网络加速保姆级教程(适用于小白)
  • 机器学习识别量子引力相变:从蒙特卡洛数据到相图自动化
  • 假设检验实战 | KS检验:从理论到Python代码的完整指南
  • Unity安卓构建实战指南:解决APK真机安装闪退与构建失败
  • AMD Ryzen平台VMware 16安装macOS Monterey避坑指南与性能调优
  • 2026年射洪市主流装饰公司盘点:射洪装饰公司/射洪装饰/射洪家装/射洪精装修/射洪整装/射洪装修公司/射洪装修/选择指南 - 优质品牌商家
  • 如何用ComfyUI-SUPIR实现专业级图像超分辨率:完整实战指南
  • Unity Instantiate卡顿根因与四层优化实战指南
  • Unity微信小游戏4MB包体优化实战:WebP分包Addressables三阶瘦身
  • 告别硬编码!Spring Cloud Gateway + Sentinel 1.8.6 动态流控规则配置实战
  • 如何快速掌握Redis可视化工具:5分钟上手完全指南
  • Unity Android SDK消失根因与五步闭环解决方案
  • Unity超休闲游戏上线模板:Google Play合规与性能预埋实践