当前位置: 首页 > news >正文

通过conda本地部署Qwen3-ASR-1.7B

一、配置说明:

我个人电脑的配置是NVIDIA RTX 5060 Ti(16G),内存32G。
语音识别速度,Qwen3-ASR-1.7B的模型,实测5分钟的录音,20秒左右可以识别出来,速度比较快。
仅cpu应该也可以,大家可以试试,那么建议用Qwen3-ASR-0.6B的模型。

二、部署方法:

1、Anaconda安装
conda安装我其它文章中已讲过,大家不会的可以网上找下安装教程,难度不大。
注意,安装好conda后,建议把下载源维护为清华源。

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2 conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ # 设置搜索时显示通道地址 conda config --set show_channel_urls yes

2、在conda中创建环境
进入conda,依次执行以下命令:

conda create-nqwen3-asrpython=3.12-yconda activate qwen3-asr

3、下载项目文件
访问github项目:https://github.com/QwenLM/Qwen3-ASR,下载压缩包到本地,解压到本地目录中。

4、安装依赖文件
在conda中使用命令进入到刚下解压的Qwen3-ASR目录中

cdE:\conda_models\envs\qwen3-asr\Qwen3-ASR-main#根据实际路径填写pipinstalltransformers streamlit soundfile librosa pipinstall-e.


5、显卡驱动和cuda
请确认显卡驱动和CUDA是否正确安装,建议更新至最新版本。可通过运行nvidia-smi命令查看当前版本信息。如需更新,请访问NVIDIA官网下载。

重要提示:务必确保驱动版本与CUDA版本相匹配,否则将无法正常调用GPU进行运算。

6、安装torch
建议通过PyTorch官网获取最新安装命令,访问地址:https://pytorch.org/get-started/locally/
我已使用最新的安装命令,如有需要可直接复制到conda中执行。

pip3installtorch torchvision --index-url https://download.pytorch.org/whl/cu130

7、下载模型
访问魔搭社区官网:https://modelscope.cn/collections/Qwen/Qwen3-ASR,选择适合的模型版本进行下载。下载完成后,请将模型文件放置于已解压的Qwen3-ASR目录内。

我简单介绍下各模型
- Qwen3-ASR-0.6B:针对小显存或cpu的配置,可以下载这个,速度更快
- Qwen3-ASR-1.7B:大于6G的显存配置,可以下载这个,语言范围更大
- Qwen3-ForcedAligner-0.6B :需要时间戳的要单独再下载这个模型



8、启动模型
请运行以下conda命令启动服务,成功后可通过http://localhost:8000访问测试页面。

#无时间戳的启动命令python-mqwen_asr.cli.demo --asr-checkpoint ./Qwen3-ASR-1.7B--backendtransformers --cuda-visible-devices0--ip0.0.0.0--port8000


http://www.jsqmd.com/news/424759/

相关文章:

  • 瑞祥商联卡闲置处理|3个核心问题,帮你避开所有坑 - 抖抖收
  • 告别MongoDB运维阵痛:一次零中断、高性能的国产数据库迁移实战
  • 手把手教你用6款AI论文工具,1天搞定全文告别熬夜赶稿 - 麟书学长
  • 力扣热题100实战 | 第9期:回文数——从字符串到整数的双重视角
  • 2026年柯桥阿里巴巴面料运营公司权威推荐,专注面料电商服务 - 品牌鉴赏师
  • 力扣热题100实战 | 第10期:正则表达式匹配——动态规划的巅峰之作
  • ④python基础课-这道题(A+B问题 IV)是动态输入处理的典型案例。它与之前的题目最大的不同点在于:每行需要求和的数字个数是不固定的,且每行的第一个数字充当了“计数器”或“指挥官”的角色。
  • 凯丽《主咖》老友相聚爆梗输出笑声不断 提倡穿衣自由上热搜引共鸣
  • [免费]hosts管理器 1.1.0
  • 使用javaw启动无命令行的java GUI应用程序
  • 东方博宜OJ 1415:10进制转D进制 ← 栈(STL stack) + 字符串
  • 2026成都GEO优化公司推荐|AI搜索优化认准橙鱼传媒,本土标杆更靠谱 - 速递信息
  • springboot+vue3医院医疗挂号信息管理系统
  • 成都党建法治文化墙设计公司TOP3:基于综合评分与核心优势评测推荐 - 速递信息
  • 2026年评价高的推拉门窗,折叠门窗厂家口碑推荐榜 - 品牌鉴赏师
  • 混凝土脱模剂选购指南:2026年科学选择的五大核心标准 - 速递信息
  • 全屋智能选哪个品牌?美的全屋智能凭全场景定制优势引领行业 - 速递信息
  • springboot+vue3中药治疗效果跟踪与患者信息管理系统
  • 拖延症福音!降AI率工具 千笔·专业降AIGC智能体 VS 学术猹,自考党必备
  • springboot+vue3人脸识别的高校门禁车辆进出管理系统的设计与实现
  • 【深度解析】快速修补料:从原理到应用的全面科普 - 速递信息
  • 2026年桥架行业主要产品类型研究参考 - 速递信息
  • AI与低代码:自动化测试开发的智能革命
  • spring boot中使用RedissonClient实现分布式锁
  • 2026 年 3 月 GEO 优化服务商综合评选:TOP10 实力排名与选型攻略 - 速递信息
  • 《R语言医学数据分析实战》学习记录|第五章 基本统计分析
  • git pull中ssh key设置
  • Ajax
  • 解密synchronized:从对象头到内存屏障,搞懂Java锁的底层原理
  • 效率直接起飞! 降AI率平台 千笔·专业降AIGC智能体 VS 灵感ai,本科生专属选择