当前位置: 首页 > news >正文

长音频离线流式识别 · 生成字幕

FireRedASR 大模型 manyspeech asr -t offline --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212 -m chunk --format srt --threads 2 -i file -f "/path/to/0.wav" # FunASR 轻量模型 manyspeech asr -t offline --model Fun-ASR-Nano-2512-LLM-int8-onnx -m chunk --format srt --threads 2 -i file -f "/path/to/0.wav"

2. 麦克风离线流式识别 · 生成字幕

manyspeech asr -t offline --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212 -m chunk --format srt --threads 2 -i mic manyspeech asr -t offline --model Fun-ASR-Nano-2512-LLM-int8-onnx -m chunk --format srt --threads 2 -i mic

3. 麦克风实时流式识别 · 实时生成字幕

manyspeech asr -t online --model paraformer-large-zh-en-int8-onnx-online -m chunk --format srt --threads 2 -i mic manyspeech asr -t online --model k2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630 -m chunk --format srt --threads 2 -i mic manyspeech asr -t online --model k2transducer-zipformer-ctc-xlarge-zh-onnx-online-yuekai-20250630 -m chunk --format srt --threads 2 -i mic

4. VAD 语音端点检测 · 剔除音频或录音的静音噪声等部分

# 麦克风在线检测 manyspeech vad -t online -i mic # 音频文件离线检测(剔除静音) manyspeech vad -t offline -f meeting.wav # 指定输出格式 manyspeech vad -t offline --format wav -f noisy_speech.wav

5. 标点符号恢复 · 为文本自动标点或重新标点(支持中英文)

# 直接输入文本 manyspeech punc --text "今天天气不错一起去郊游吧" # 从文件读取 manyspeech punc -f transcript.txt # 指定输出JSON格式 manyspeech punc --text "hello world" --format json # 交互输入 manyspeech punc
http://www.jsqmd.com/news/1078919/

相关文章:

  • ENDO 2026 | 怡培生长激素基于IGF-1水平的剂量调整研究
  • 终极指南:如何在Unreal Engine中实现运行时音频导入功能
  • 问卷分支逻辑怎么设?2026年问卷平台选型与零基础上手实操教程
  • 青椒预算捉襟见肘!68元月豆包vs医学垂直AI,性价比实测对比
  • Awesome-POC:1000 多个漏洞 PoC,全按类别整理好了
  • 《认知红利》书摘2
  • 矿山数字化安全升级,一文读懂 AI 视觉在煤矿落地场景与核心价值
  • 江西单招升学如何稳上岸?铸人职教升学本土多年教研,助力学子圆梦公办大专
  • 三大技术革新重塑远程控制:billd-desk开源跨平台解决方案深度解析
  • Scraping APIs for Developers:2622个现成爬虫API,开发者的工具箱
  • Java Map 循环:遍历方式与性能对比
  • 免费查降AI率软件推荐:中英文AIGC痕迹一键检测
  • RS485 通信信号线使用共模电感,这几个关键点一定要注意
  • 东莞注塑模具加工厂真实体验怎么样?
  • 后端转Agent开发, 别上来就死嗑python
  • 某宝sign,_m_h5_tk,_m_h5_tk_enc逆向
  • MTX双面解析:从多线程互斥锁到游戏微交易系统设计
  • Embedding 模型微调实战:从 22% 到 97.9% 的踩坑记录
  • 基于QUBO模型的量子计算在信用评分卡组合优化中的应用研究
  • scikit-learn工业级建模实战:从数据加载到上线部署的26个关键节点
  • 研究技术软件工程研究方法的实证研究与案例研究对比
  • 分层设计的记忆系统
  • 多模态RAG实战:让AI真正看懂PDF中的文字、表格与流程图
  • 25元打造AI智能眼镜:OpenGlass开源项目技术解析与实现指南
  • AI 建议加索引后查询仍变慢:从联合索引、回表与分页排序看慢 SQL 排查
  • 安装 Envoy Gateway
  • 知识库文档清洗:垃圾进垃圾出
  • AI模型访问控制机制与能力评估实践指南
  • C++大成之路:右值引用 move 语义
  • 抖音账号与手机号关联验证:合规路径、技术实现与风险规避指南