当前位置：首页 > news >正文

Qwen3.5-2B模型在VMware虚拟机中的隔离部署与测试方案

news 2026/8/2 22:00:20

Qwen3.5-2B模型在VMware虚拟机中的隔离部署与测试方案

1. 引言

在AI模型开发过程中，环境隔离和资源复用是许多开发者面临的常见需求。本文将手把手教你如何在VMware虚拟机中部署和测试Qwen3.5-2B模型，创建一个干净、隔离的开发环境。

通过本教程，你将学会：

在VMware中创建并配置Ubuntu虚拟机
安装必要的GPU透传驱动
在虚拟化环境中配置Docker和CUDA
运行Qwen3.5-2B模型并进行性能测试

这种方法特别适合需要同时运行多个项目、或者希望保持主机系统干净的开发者。

2. 环境准备

2.1 硬件与软件要求

在开始之前，请确保你的系统满足以下要求：

主机系统：Windows 10/11或Linux（已安装VMware Workstation Pro 16+）
CPU：支持虚拟化的Intel VT-x或AMD-V技术
GPU：NVIDIA显卡（建议RTX 3060及以上）
内存：至少16GB（建议32GB）
存储空间：至少50GB可用空间

2.2 下载必要文件

你需要准备以下文件：

Ubuntu 20.04/22.04 LTS ISO镜像
VMware Workstation Pro最新版
NVIDIA显卡驱动（与你的GPU型号匹配）
Docker CE安装包

3. 创建并配置Ubuntu虚拟机

3.1 新建虚拟机

打开VMware Workstation，点击"创建新的虚拟机"
选择"自定义(高级)"配置
选择Ubuntu ISO镜像作为安装源
分配至少4个CPU核心和16GB内存
创建至少50GB的虚拟硬盘（建议选择"单个文件"存储方式）

3.2 安装Ubuntu系统

启动虚拟机，按照常规步骤安装Ubuntu
安装时选择"最小化安装"和"安装第三方软件"
完成安装后，更新系统软件包：

sudo apt update && sudo apt upgrade -y

3.3 配置虚拟机设置

关闭虚拟机，进入VMware的虚拟机设置
在"处理器"选项中，启用"虚拟化Intel VT-x/EPT或AMD-V/RVI"
在"显示器"选项中，启用3D加速
保存设置并重新启动虚拟机

4. 安装GPU透传驱动

4.1 安装NVIDIA驱动

首先禁用nouveau驱动：

sudo bash -c "echo 'blacklist nouveau' >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf" sudo bash -c "echo 'options nouveau modeset=0' >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf" sudo update-initramfs -u

重启虚拟机后，安装NVIDIA驱动：

sudo apt install nvidia-driver-535 -y

验证驱动安装：

nvidia-smi

你应该能看到GPU信息输出。

4.2 配置PCI透传

在主机上找到GPU的PCI设备ID：

lspci -nn | grep NVIDIA

关闭虚拟机，编辑虚拟机.vmx文件，添加以下内容：

pciPassthru0.msiEnabled = "FALSE" pciPassthru0.id = "设备ID" pciPassthru0.present = "TRUE"

保存文件后重新启动虚拟机。

5. 安装Docker和CUDA

5.1 安装Docker CE

安装Docker依赖项：

sudo apt install apt-transport-https ca-certificates curl software-properties-common -y

添加Docker官方GPG密钥：

curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg

添加Docker仓库：

echo "deb [arch=amd64 signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

安装Docker CE：

sudo apt update && sudo apt install docker-ce docker-ce-cli containerd.io -y

将当前用户加入docker组：

sudo usermod -aG docker $USER newgrp docker

5.2 安装NVIDIA Container Toolkit

添加NVIDIA容器工具包仓库：

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \ && curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \ && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

安装NVIDIA容器工具包：

sudo apt update && sudo apt install -y nvidia-docker2

重启Docker服务：

sudo systemctl restart docker

验证安装：

docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi

你应该能看到与主机上相同的GPU信息输出。

6. 部署Qwen3.5-2B模型

6.1 拉取模型镜像

从镜像仓库拉取Qwen3.5-2B模型：

docker pull qwen/qwen3.5-2b:latest

6.2 运行模型容器

启动模型容器：

docker run -it --rm --gpus all -p 7860:7860 qwen/qwen3.5-2b:latest

容器启动后，你可以通过浏览器访问http://localhost:7860来使用Web界面。

6.3 命令行测试

你也可以直接在容器内进行命令行测试：

docker exec -it <容器ID> bash python3 -c "from transformers import pipeline; generator = pipeline('text-generation', model='Qwen/Qwen3.5-2B'); print(generator('人工智能是'))"

7. 性能测试与优化

7.1 基准测试

运行推理速度测试：

docker exec -it <容器ID> bash python3 -c "import time; from transformers import pipeline; generator = pipeline('text-generation', model='Qwen/Qwen3.5-2B'); start = time.time(); generator('人工智能是', max_length=50); print(f'推理时间: {time.time()-start:.2f}秒')"