当前位置: 首页 > news >正文

Docker+vLLM内网离线部署Qwen3 流程

Docker + vLLM 内网离线部署 Qwen3-32B 完整教程

环境准备

Nvidia显卡驱动、CUDA、nvidia-container安装
参考:http:
Docker环境安装
参考:http:

注意:在进行VLLM容器化部署之前,需要确保已在服务器上安装了Docker 和
Nvidia显卡驱动、CUDA、nvidia-container。

一、部署流程概述

部署流程主要分为三个关键步骤:

  1. 准备vLLM镜像- 在联网环境下载并导入内网
  2. 获取模型文件- 从模型仓库下载Qwen3-32B模型
  3. 启动推理服务- 使用Docker运行vLLM服务

下面详细介绍每个步骤的具体操作。

二、详细操作步骤

1. 离线获取 vLLM 镜像

由于内网服务器无法直接访问Docker Hub,需要在有网络的机器上先拉取镜像,然后传输到内网服务器。

在可联网的机器上执行:

# 拉取官方vLLM镜像(大小约20GB,下载需要较长时间)docker pull vllm/vllm-openai# 将镜像打包保存为文件docker save -o vllm-openai-image.tar vllm/vllm-openai:latest

在内网服务器上执行:

# 进入保存镜像文件的目录cd/data# 从文件加载镜像到本地Dockerdocker load<vllm-openai-image.tar# 验证镜像是否加载成功(应该能看到vllm/vllm-openai镜像)docker images|grepvllm-openai

2. 下载 Qwen3-32B 模型文件

模型可以从以下几个平台下载(推荐使用国内源提升下载速度):

  • Hugging Face Hub(国内镜像):https://hf-mirror.com/
  • ModelScope 魔搭社区:https://www.modelscope.cn/models
  • GitCode:https://gitcode.net/

本文以魔搭社区为例,使用git下载:

# 确保已安装git-lfs(大文件支持)gitlfsinstall# 克隆模型仓库(模型大小约62GB,下载需要很长时间)gitclone https://www.modelscope.cn/Qwen/Qwen3-32B.git

下载完成后,将整个模型文件夹复制到内网服务器的/data/Qwen3-32B目录下。

3. 启动 vLLM 推理服务

使用以下命令启动服务容器,请根据实际情况调整参数:

docker run -d --privileged --gpus all\--restart unless-stopped\--networkhost\-v /data/Qwen3-32B:/app/model\--shm-size 32G\--name vllm-qwen3\vllm/vllm-openai:latest\--model /app/model\--served-model-name qwen3:32b
http://www.jsqmd.com/news/87569/

相关文章:

  • 18、使用微软Face API进行图片人脸检测
  • 2025年年终品牌证明公司推荐:聚焦IPO与消费行业,专家严选5家权威资质覆盖的优质服务商清单 - 十大品牌推荐
  • Django 中使用django-redis库与Redis交互API指南
  • 2025年年终品牌证明公司推荐:从涉外调查到ESG审验,涵盖核心资质的5家标杆机构盘点 - 十大品牌推荐
  • 北京物流公司哪家服务更全面可靠?2025年年终最新市场深度评测及5家实力派服务商推荐! - 十大品牌推荐
  • Snipe-IT多语言配置终极指南:打造国际化资产管理平台
  • AutoGPT与TensorFlow Serving集成:模型部署自动化
  • 开拓者:正义之怒多职业兼职深度攻略
  • any-listen:构建专属私人音乐空间的完整解决方案
  • 突破性音频AI技术:Step-Audio 2系列重塑智能语音交互新范式
  • 2025年年终北京物流公司推荐:从全国网络到专业包装,5家知名物流企业核心优势与口碑聚焦 - 十大品牌推荐
  • Step-Audio 2:重新定义人机语音交互的技术革命
  • 68、《系统调试相关命令与错误代码解析》
  • 企业物流外包如何选择靠谱伙伴?2025年年终北京地区物流服务商综合评估与5家推荐! - 十大品牌推荐
  • 2025年消费者推荐:山东优质阿胶生产厂家排行,膏方/膏方类产品/非遗膏方/阿胶类/阿胶/阿胶产品/阿胶类产品/阿胶糕阿胶采购推荐榜单 - 品牌推荐师
  • 2025年年终北京物流公司推荐:专家聚焦大件、冷链与普货场景的5家优质服务商选购指南 - 十大品牌推荐
  • 15、加密算法实现与应用
  • 在AI技术能够快速实现功能的时代,挖掘隐藏需求才是制胜关键——某知名Android自动化工具需求深度剖析
  • 目标检测与图像分割的5个核心技巧:从零基础到实战高手
  • 实用指南:如何使用WPF做工控主页
  • 秒会Python基础:函数的介绍与用法
  • 16、密码学与网络服务编程实践
  • 2025年年终市场认证机构推荐:聚焦广告合规与市场地位证明,专家深度评测5家优质服务商选购指南 - 十大品牌推荐
  • Armbian音频配置终极指南:从静音到专业级声音体验
  • 69、操作系统编程关键知识与技术详解
  • AutoGPT与Stable Diffusion联用:图文内容协同生成新玩法
  • 智能地址解析终极指南:高效处理非标准化地址数据
  • Edge TTS技术深度解析:解锁跨平台微软语音合成新可能
  • PixiEditor MVVM架构深度解析:构建可维护的跨平台像素艺术编辑器
  • 3倍效率提升:Heroicons图标检索与使用终极指南