当前位置：首页 > news >正文

中文语音识别不建议使用VOSK

news 2026/3/27 3:09:49

40几MB的vosk-model-small-cn-0.3，识别率极低，识别速度极慢。

1.3GB的vosk-model-cn-0.22没试，想必速度不会更快。

网站上Models里只有vosk-model-small-cn-0.22，没有0.3

vosk-transcriber --list-models

vosk-transcriber -n model -i input -o output 会下载model

输入可以是有视频的.mp4。

ffmpeg -i $1 -ac 1 -ar 16000 -acodec pcm_s16le t.wav 提取.mp4里的音频。

vosk-transcriber -l cn -n model 把语言也指定上，输入换成wav，识别结果一样。

pip uninstall 卸载。

vosk-transcriber自动下载的模型在~/.cache/vosk下。

http://www.jsqmd.com/news/13497/

相关文章：

213123123123123

VSCode插件开发的注意点 - Erica

时序数据库 IoTDB 集成 DataGrip，支撑跨模态多库融合管理

Sql Server安装报错“服务没有及时响应启动或控制请求”

题解：CF1830E Bully Sort

斑马日记2025.10.10

单片机概念

斑马日记2025.10.12

Androidify：基于Gemini AI的安卓机器人定制应用

入门指南：使用 Playwright MCP Server 为你的 AI Agent 赋予浏览器自动化能力

实战教程：构建能交互网页的 AI 助手——基于 Playwright MCP 的完整项目

2025 年国内卷板机源头厂家最新推荐排行榜：涵盖不锈钢 / 大型 / 锥形 / 数控等多类型设备，助力企业精准采购优质设备

达梦开启awr功能报错：[-7160]:Object [DBMS_WORKLOAD_REPOSITORY_DATA_LOW] is invalid

ceph日常管理

mysql5.7 AUTO_INCREMENT 问题

Flash游戏浏览器

vi/vim 的使用及 CentOS 静态网络配置并链接 Xshell

102500410 杜惟真 10月14日作业

alpline 构建lnmp

2025 年最新推荐操作台厂家排行榜：覆盖指挥中心 / 控制室 / 中控室 / 监控室 / 调度室场景，为用户选购优质产品提供专业参考

Ubuntu tightenVNC安装及配置

NVR设备ONVIF接入平台EasyCVR智慧小区视频监控系统建设方案

FPGA开发流程

毕业论文技巧：Word中使用Mathtype对公式自动编号（带章节号）

浩辰CAD 2025 SP2安装包下载与安装教程

高级程序语言设计第一次作业

Java word文档中的图片抽离方法

Kerberos认证(Elasticsearch)