当前位置: 首页 > news >正文

中文语音识别不建议使用VOSK

40几MB的vosk-model-small-cn-0.3,识别率极低,识别速度极慢。

1.3GB的vosk-model-cn-0.22没试,想必速度不会更快。

网站上Models里只有vosk-model-small-cn-0.22,没有0.3

vosk-transcriber --list-models

vosk-transcriber -n model -i input -o output 会下载model

输入可以是有视频的.mp4。

ffmpeg -i $1 -ac 1 -ar 16000 -acodec pcm_s16le t.wav 提取.mp4里的音频。

vosk-transcriber -l cn -n model 把语言也指定上,输入换成wav,识别结果一样。

pip uninstall 卸载。

vosk-transcriber自动下载的模型在~/.cache/vosk下。

http://www.jsqmd.com/news/13497/

相关文章:

  • 213123123123123
  • VSCode插件开发的注意点 - Erica
  • 时序数据库 IoTDB 集成 DataGrip,支撑跨模态多库融合管理
  • Sql Server安装报错“服务没有及时响应启动或控制请求”
  • 题解:CF1830E Bully Sort
  • 斑马日记2025.10.10
  • 单片机概念
  • 斑马日记2025.10.12
  • Androidify:基于Gemini AI的安卓机器人定制应用
  • 入门指南:使用 Playwright MCP Server 为你的 AI Agent 赋予浏览器自动化能力
  • 实战教程:构建能交互网页的 AI 助手——基于 Playwright MCP 的完整项目
  • popcount 题
  • 2025 年国内卷板机源头厂家最新推荐排行榜:涵盖不锈钢 / 大型 / 锥形 / 数控等多类型设备,助力企业精准采购优质设备
  • 达梦开启awr功能报错:[-7160]:Object [DBMS_WORKLOAD_REPOSITORY_DATA_LOW] is invalid
  • ceph日常管理
  • mysql5.7 AUTO_INCREMENT 问题
  • Flash游戏浏览器
  • vi/vim 的使用及 CentOS 静态网络配置并链接 Xshell
  • 102500410 杜惟真 10月14日作业
  • alpline 构建lnmp
  • 2025 年最新推荐操作台厂家排行榜:覆盖指挥中心 / 控制室 / 中控室 / 监控室 / 调度室场景,为用户选购优质产品提供专业参考
  • Ubuntu tightenVNC安装及配置
  • NVR设备ONVIF接入平台EasyCVR智慧小区视频监控系统建设方案
  • FPGA开发流程
  • 毕业论文技巧:Word中使用Mathtype对公式自动编号(带章节号)
  • 试验2
  • 浩辰CAD 2025 SP2安装包下载与安装教程
  • 高级程序语言设计第一次作业
  • Java word文档中的图片抽离方法
  • Kerberos认证(Elasticsearch)