当前位置：首页 > news >正文

Qwen3.5-4B-AWQ实战教程：supervisor管理服务+日志定位+崩溃自恢复

news 2026/6/12 12:23:31

Qwen3.5-4B-AWQ实战教程：supervisor管理服务+日志定位+崩溃自恢复

1. 项目概述

Qwen3.5-4B-AWQ-4bit是阿里云通义千问团队推出的轻量级稠密模型，经过4bit AWQ量化后显存占用仅约3GB，使得RTX 3060/4060等消费级显卡也能流畅运行。该模型在保持轻量化的同时，性能表现优异：

性能均衡：MMLU-Pro得分接近Qwen3-30B-A3B，OmniDocBench表现超越GPT-5-Nano
全能力覆盖：支持201种语言处理、原生多模态(图文)理解、长上下文处理以及工具调用
部署友好：适配llama.cpp、vLLM等主流推理引擎

核心参数：

模型路径：/root/ai-models/cyankiwi/Qwen3___5-4B-AWQ-4bit
推理引擎：vLLM
WebUI端口：7860

2. 服务管理实战

2.1 服务状态监控

使用supervisorctl可以方便地查看服务运行状态：

supervisorctl status

正常运行时将显示类似输出：

qwen35-4b-awq RUNNING pid 12345, uptime 0:05:23

2.2 服务启停控制

通过以下命令管理服务生命周期：

# 启动服务 supervisorctl start qwen35-4b-awq # 停止服务 supervisorctl stop qwen35-4b-awq # 重启服务（推荐修改配置后使用） supervisorctl restart qwen35-4b-awq

2.3 日志查看技巧

日志是排查问题的关键，模型提供了两种日志：

# 实时查看运行日志（Ctrl+C退出） tail -f /root/Qwen3.5-4B-AWQ-4bit/logs/webui.log # 查看错误日志（重点关注） tail -f /root/Qwen3.5-4B-AWQ-4bit/logs/webui.err.log

日志分析技巧：

搜索"ERROR"或"Exception"快速定位问题
注意时间戳判断问题发生时间点
大段错误信息通常包含关键堆栈跟踪

3. WebUI访问与调试

3.1 正常访问

服务启动成功后，通过浏览器访问：

http://localhost:7860

3.2 手动调试模式

当需要调试或supervisor异常时，可手动运行：

cd /root/Qwen3.5-4B-AWQ-4bit /opt/miniconda3/envs/torch28/bin/python webui.py

注意：手动运行时需保持终端开启，关闭终端会导致服务终止。

4. 崩溃自恢复机制

项目已配置完善的崩溃恢复策略：

开机自启：supervisor配置中设置autostart=true
崩溃重启：autorestart=true确保异常退出后自动恢复
守护进程：supervisord本身也已配置为系统服务

验证自启配置：

cat /root/Qwen3.5-4B-AWQ-4bit/supervisor.conf | grep -E "autostart|autorestart"

5. 常见问题解决

5.1 GPU显存问题

若服务启动失败并提示显存不足，按以下步骤处理：

# 1. 检查当前显存占用 nvidia-smi # 2. 查找可能的残留进程 ps aux | grep VLLM # 3. 终止残留进程（替换<PID>为实际进程ID） kill -9 <PID> # 4. 重新启动服务 supervisorctl start qwen35-4b-awq

5.2 端口冲突

若7860端口被占用，可修改webui.py中的端口配置后重启服务。

6. 项目目录结构

了解目录结构有助于问题定位：

/root/Qwen3.5-4B-AWQ-4bit/ ├── webui.py # 主程序入口 ├── supervisor.conf # 服务管理配置 └── logs/ ├── webui.log # 标准运行日志 └── webui.err.log # 错误日志（重点监控）

7. 总结

通过本教程，您已经掌握：

使用supervisor高效管理Qwen3.5-4B-AWQ服务
通过日志分析快速定位各类问题
利用崩溃自恢复机制保障服务稳定性
解决常见的GPU显存和端口冲突问题

建议定期检查日志文件，特别是在服务异常后，可以从中获取有价值的调试信息。对于生产环境，可以考虑配置日志轮转避免磁盘空间耗尽。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

查看全文

http://www.jsqmd.com/news/697221/

机器学习数据预处理实战：20+技巧提升模型效果

从游戏角色瞄准到机械臂抓取：详解‘圆外一点求切线切点’的几何编程实战

SSC工具详解：从ESI文件生成到CiA402伺服驱动从站配置实战

别再傻傻分不清了！Protobuf序列化时，SerializeToString和SerializePartialToString到底该用哪个？

Unity进阶：巧用FBX Exporter打通3DMax到Unity的无损数据管道

Java的java.util.random测试使用

解锁B站视频自由：开源下载工具全解析与实战指南

用Unity 2D复刻经典：如何为你的“Ruby‘s Adventure”添加完整的任务系统与NPC对话（含C#脚本详解）

告别pip依赖地狱：从ERROR到成功安装的实战解决指南

FLAH写入和写出不一致怎么办？

Keil安装路径非默认导致DFP下载失败的排查与修复指南

从AutoCAD到Revit：手把手教你用AutoLISP脚本批量导出天正墙体数据

py每日spider案例之某kedou视频解析参数逆向

别再死记硬背了！用华为eNSP模拟器实战拆解OSPF的5种网络类型（BMA/P2P/P2MP/NBMA）

MT4 EA避坑指南：从Nerve Knife策略看如何设计‘永不爆仓’的风控模块

Linux系统之rename命令的版本差异与实战场景

DataX新手入门：5分钟搞定你的第一个数据同步任务（StreamReader到StreamWriter实战）

别再傻傻分不清！STM32下载器STLINK和USB-TTL到底怎么选？附FlyMcu救砖指南

如何在GTA V中安全使用YimMenu开源模组菜单：新手避坑指南

第73篇：AI驱动市场研究与竞品分析——自动抓取、情感分析与趋势报告生成（项目实战）

【嵌入式AI落地黄金公式】：3类芯片（STM32H7/ESP32-C3/NXP RT1170）+4种C内存模型+1套LLM适配框架=工业级边缘智能

别再死记硬背了！用Go/Python写个玩具DB，亲手实现一遍MVCC

别再只会用sudo了！Python脚本遇到PermissionError: [Errno 13]的5种实战排查思路

别再只用chmod了！聊聊Linux里那个更‘霸道’的文件保护命令chattr

歌词滚动姬：零基础制作专业LRC歌词的终极指南

别再只看FLOPs了！从ShuffleNetV2的4条设计准则，聊聊移动端CNN模型怎么才算真的‘快’

StreamCap：免费开源的多平台直播录制神器，你的专属直播内容管家

基于OpenAI实时API构建语音操作系统：架构、实现与安全实践

别再盲目memcpy！嵌入式C中模型权重加载的4种内存对齐误用，已致3起量产固件崩溃

YOLOv11-seg改进系列 | 引入MetaFormer TPAMI2024的C3k2_ConvFormer模块，SepConv卷积式Token Mixer替换C3k2，复杂场景分割更稳

Qwen3.5-4B-AWQ实战教程：supervisor管理服务+日志定位+崩溃自恢复

1. 项目概述

2. 服务管理实战

2.1 服务状态监控

2.2 服务启停控制

2.3 日志查看技巧

3. WebUI访问与调试

3.1 正常访问

3.2 手动调试模式

4. 崩溃自恢复机制

5. 常见问题解决

5.1 GPU显存问题

5.2 端口冲突

6. 项目目录结构

7. 总结

相关文章：