当前位置: 首页 > news >正文

ManySpeech-CLI:开箱即用的本地命令行语音识别工具

ManySpeech-CLI 是一款免费、开箱即用、本地运行的命令行语音识别工具,支持本地音频文件识别、麦克风实时流式识别,自带交互操作模式,模型自动下载、离线推理、字幕生成均可通过命令一键完成。

工具无需云端、无需 GPU、无需复杂环境配置,下载解压即可使用,支持多种高质量语音模型,语言覆盖广泛。首次使用时联网自动下载模型,后续全程本地离线运行,音频不上云、不泄露,适合会议录音、私人录音等隐私场景。


典型使用示例

1. 长音频离线识别 + 生成字幕

# FireRedASR 大模型manyspeech asr-toffline--modelfireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212-mchunk--formatsrt--threads2-ifile-f"/path/to/0.wav"# FunASR 轻量模型manyspeech asr-toffline--modelFun-ASR-Nano-2512-LLM-int8-onnx-mchunk--formatsrt--threads2-ifile-f"/path/to/0.wav"

2. 麦克风实时语音识别

manyspeech asr-tonline--modelparaformer-large-zh-en-int8-onnx-online-mchunk--formatsrt--threads2-imic manyspeech asr-tonline--modelk2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630-mchunk--formatsrt--threads2-imic manyspeech asr-tonline--modelk2transducer-zipformer-ctc-xlarge-zh-onnx-online-yuekai-20250630-mchunk--formatsrt--threads2-imic

3. 语音静音检测(VAD)

# 麦克风在线检测manyspeech vad-tonline-imic# 音频文件离线检测(剔除静音)manyspeech vad-toffline-fmeeting.wav# 指定输出格式manyspeech vad-toffline--formatwav-fnoisy_speech.wav

4. 自动标点符号恢复

# 直接输入文本manyspeech punc--text"今天天气不错一起去郊游吧"# 从文件读取manyspeech punc-ftranscript.txt# 指定输出JSON格式manyspeech punc--text"hello world"--formatjson# 交互输入manyspeech punc

相关链接

  • 📚 官方文档:https://manyeyes.github.io/manyspeech/
  • 📥 软件下载:https://manyeyes.github.io/manyspeech/cli/getting-started/installation.html
  • 🧩 模型查询:https://modelscope.cn/profile/manyeyes?tab=model

🔗 参考
ManySpeech​

http://www.jsqmd.com/news/900454/

相关文章:

  • AI工具集:本地Node基于云端AI模型使用Stdio封装自定义MCP服务
  • 基于断言与故障分析的RTL级近似计算自动化探索方法
  • 为什么你的ChatGPT健身计划总失败?运动生理学博士揭穿5大AI认知盲区,附可立即复用的Prompt黄金模板
  • Linux内核开发者视角:深入SMMUv3驱动,手把手拆解dma_map_sg()的IOVA连续映射魔法
  • 如何快速轻松地删除 iPhone/iPad 上的提醒事项
  • 国产第一!Qwen3.7-Max全端上线,好易智算同步首发,企业级Agent底座再添新选择
  • 收藏 | RAG技术揭秘:让AI回答更靠谱,小白也能轻松上手学大模型!
  • 5G毫米波信道模型对比:3GPP与NYUSIM如何影响系统设计与性能评估
  • 别再乱选电容了!手把手教你搞定阻容降压电路,从0.47uF到安规X2电容的保姆级选型指南
  • 避坑指南:你的PLS-DA结果可靠吗?聊聊mixOmics包里的scale、logratio与near.zero.var参数设置
  • 面壁开源1B端侧模型,AI Yang的“端云协同”路线得到验证
  • 基于 HarmonyOS 6.0 的日程备忘应用:时间线组件与任务状态管理详解
  • 基于OpenCL的FPGA信号处理:低延迟流水线设计与工程实践
  • 别再只盯着准确率了!手把手教你用Python计算语义分割的MIoU(附完整代码)
  • 抖音无水印下载:从手动保存到自动化批量采集的终极方案
  • 无广告免费壁纸工具,手机电脑壁纸随心更换
  • 大模型下半场:从“模型能力”到“系统能力”,RAG、Agent如何重塑产业竞争格局?
  • C语言中求余运算符的使用解读
  • AI应用可观测性工程2026:LLM调用追踪评估与监控全栈实践
  • 保姆级教程:用CAT_pack和IMG/VR4数据库搞定宏基因组contig物种分类(附蛋白ID与TaxID映射避坑指南)
  • 跨越十个数量级的能效革命:从GPU到忆阻器,神经计算硬件的能耗全景与路径选择
  • 睡眠呼吸暂停监测:轻量化CNN与ECG信号分析
  • jQuery Mobile 页面
  • 项目介绍 MATLAB实现基于BMA-XGB 贝叶斯模型平均(BMA)结合极端梯度提升(XGB)进行股票价格预测(含模型描述及部分示例代码)专栏近期有大量优惠 还请多多点一下关注 加油 谢谢 你的鼓励
  • LeetCode 22. 括号生成(JS里的回溯算法)
  • CPT Markets:多维度评测平台透明度与稳定性
  • 终极指南:3分钟掌握FSearch极速文件搜索神器,告别Linux找文件烦恼!
  • 基于 HarmonyOS 6.0 的日程备忘应用:待办事项板与提醒卡片详解
  • 2026最新!3款抖音视频提取免费神器,亲测无水印直存,真香体验好用到哭!
  • 【限时首发】ChatGPT生日派对创意黄金公式:基于217场真实活动AB测试提炼的5大变量模型