当前位置：首页 > news >正文

Qwen3-ASR-0.6B入门必看：从WebUI上传到API调用的完整操作手册

news 2026/7/10 6:02:55

Qwen3-ASR-0.6B入门必看：从WebUI上传到API调用的完整操作手册

1. 快速了解Qwen3-ASR-0.6B语音识别模型

Qwen3-ASR-0.6B是一个轻量级但性能强大的语音识别模型，专门为实际应用场景设计。这个模型只有6亿参数，但识别效果却相当不错，特别适合需要快速响应和高并发处理的场景。

这个模型基于Qwen3-Omni基座和自研的AuT语音编码器，最大的特点是支持多种语言和方言。无论你是想在边缘设备上部署，还是在云端提供服务，它都能很好地平衡识别精度和运行效率。

1.1 核心功能特点

多语言支持：能识别52种不同的语言和方言，包括30种主流语言和22种中文方言
格式兼容：支持wav、mp3、m4a、flac、ogg等多种音频格式
大文件处理：最大可以处理100MB的音频文件
GPU加速：使用bfloat16精度进行GPU加速，处理速度更快

2. 服务基本信息

在开始使用之前，我们先了解一下服务的基本信息：

项目	说明
模型名称	Qwen3-ASR-0.6B
Web访问地址	`http://<你的服务器IP>:8080`
API服务端口	8000（内部使用）
Web界面端口	8080（外部访问）

你只需要将<你的服务器IP>替换成实际的服务IP地址，就可以开始使用了。

3. Web界面使用指南

Web界面是最简单的使用方式，不需要写代码就能完成语音识别。

3.1 通过上传文件进行转录

这是最常用的方式，适合处理本地音频文件：

打开浏览器，访问http://<服务器IP>:8080
你会看到一个文件上传区域，点击或者直接把音频文件拖拽到这个区域
如果需要，可以选择音频的语言（不选的话会自动检测）
点击"开始转录"按钮，等待处理完成

3.2 通过URL链接进行转录

如果你有在线音频文件，可以直接用URL方式：

在Web界面中切换到"URL链接"标签
输入音频文件的完整URL地址
点击"开始转录"按钮

处理完成后，识别结果会直接显示在页面上，你可以复制或者下载文本内容。

4. API接口调用详解

如果你需要在自己的程序中使用语音识别功能，API接口是最佳选择。

4.1 服务健康检查

在调用API之前，建议先检查服务状态：

curl http://<IP>:8080/api/health

如果服务正常，你会看到这样的响应：

{ "status": "healthy", "model_loaded": true, "gpu_available": true, "gpu_memory": { "allocated": 1.46, "cached": 1.76 } }

这表示服务运行正常，模型加载成功，并且GPU可用。

4.2 文件上传转录API

通过API上传本地文件进行识别：

curl -X POST http://<IP>:8080/api/transcribe \ -F "audio_file=@你的音频文件.mp3" \ -F "language=Chinese"

把你的音频文件.mp3换成实际的文件路径，language参数可以指定语言，如果不指定会自动检测。

4.3 URL转录API

直接识别在线音频文件：

curl -X POST http://<IP>:8080/api/transcribe_url \ -H "Content-Type: application/json" \ -d '{ "audio_url": "https://example.com/audio.mp3", "language": "Chinese" }'

这种方式适合处理已经存储在云端的音频文件。

5. 支持的语言列表

Qwen3-ASR-0.6B支持的语言相当丰富，以下是主要支持的语言：

5.1 主流语言

中文、英文、粤语、阿拉伯语、德语、法语、西班牙语、葡萄牙语、印尼语、意大利语、韩语、俄语、泰语、越南语、日语、土耳其语、印地语、马来语等30种语言。

5.2 中文方言

安徽话、东北话、福建话、甘肃话、贵州话、河北话、河南话、湖北话、湖南话、江西话、宁夏话、山东话、陕西话、山西话、四川话、天津话、云南话、浙江话、吴语、闽南话等22种方言。

6. 服务管理和监控

如果你需要管理服务或者查看运行状态，可以使用以下命令：

6.1 服务状态管理

# 查看服务运行状态 supervisorctl status qwen3-asr-service # 重启服务 supervisorctl restart qwen3-asr-service # 查看实时日志 tail -f /root/qwen3-asr-service/logs/app.log

6.2 项目目录结构

了解项目结构有助于故障排查：

/root/qwen3-asr-service/ ├── app/main.py # 主要的API应用 ├── webui/ │ ├── index.html # Web界面页面 │ └── server.py # 反向代理服务器 ├── logs/ # 日志文件目录 ├── scripts/monitor.py # 监控脚本 └── requirements.txt # 依赖包列表