当前位置: 首页 > news >正文

GPUStack Windows(WSL2)部署指南

GPUStack v2 以高性能推理与生产级稳定性为核心演进方向,对整体架构进行了全面重构,实现了组件间的灵活解耦,并对多推理引擎和异构算力进行了深度优化,充分释放推理引擎在吞吐、延迟与并发方面的性能潜力。

基于这一架构设计,GPUStack v2 聚焦 Linux 原生环境,以充分利用其在生态和 AI 基础设施领域的成熟优势。

对于 Windows 用户,推荐通过 WSL2(Windows Subsystem for Linux) 运行 GPUStack v2,在 Windows 上构建与 Linux 生产环境高度一致的 AI 运行环境,完整体验 v2 带来的性能优化与架构优势。

整篇稍长,可先看以下总结的六点,有问题再细看全文:

  1. 驱动安装:在 Windows 主机安装 NVIDIA 驱动,不要在 WSL 内部安装。
  2. CUDA 环境:无需 CUDA Toolkit(Windows/WSL 均不需要)。
  3. 容器环境:请在 WSL 内部安装原生 Docker Engine,不要使用 Docker Desktop。
  4. (可选)局域网访问:若需局域网访问 Server,可在 "WSL Settings" 中将网络模式配置为 Mirrored
  5. 环境检测:运行环境检测时,请使用 默认用户,不要使用 root 用户(nvidia-smi 在 WSL 中的非标准路径中,此路径不在 root 用户下的环境变量中)。
  6. IP 配置:Worker IP 填写 WSL 的具体 IP,使用 127.0.0.1 可能存在问题。

下面将详细介绍如何在 WSL 环境中配置 NVIDIA GPU 并部署 GPUStack。

1. 实验环境

本文基于以下实验环境编写,但适用于大多数支持 WSL 的 Windows 10/11 系统。

  • 操作系统:Windows 11
  • 硬件:GeForce RTX 4090D
  • 虚拟化:需在 BIOS/UEFI 中开启虚拟化支持

2. 关键架构说明

相关参考文档:

  • Microsoft WSL 官方文档(GPU 支持):https://learn.microsoft.com/en-us/windows/wsl/tutorials/gpu-compute
  • NVIDIA CUDA on WSL 用户指南:https://docs.nvidia.com/cuda/wsl-user-guide/index.html

在 WSL 中部署 GPUStack 有两点需要注意:

2.1 驱动安装

在 Windows 系统中安装 NVIDIA 显卡驱动,不要在 WSL 中安装。WSL 内部会自动通过 Passthrough 机制调用宿主机的驱动,在 WSL Linux 发行版中重复安装 NVIDIA 驱动或 CUDA Toolkit 可能会破坏现有环境。

2.2 容器运行时

请使用原生 Docker Engine,不要使用 Docker Desktop 集成。Docker Desktop 的网络模型与标准 Docker Engine 不同,会导致 GPUStack 组件间通信失败。

如果已经安装 Docker Desktop,请在 Docker Desktop 设置中关闭对目标子系统的集成。参考配置如图所示:

3. 环境准备步骤

步骤 1:安装 NVIDIA 驱动(Windows 端)

前往 NVIDIA 官方驱动下载页面,根据显卡型号下载并安装Windows 版本的最新驱动程序。

  • 下载地址:https://www.nvidia.com/en-us/drivers/

步骤 2:安装或更新 WSL(Windows 端)

以管理员身份打开 PowerShell 或命令提示符,执行以下命令安装或更新 WSL:

# 安装 WSL(默认安装 Ubuntu)
wsl --install# 或者更新 WSL 至最新内核
wsl --update
  • 注意:首次安装 WSL 后,系统可能要求重启计算机。
  • 详细步骤参考:https://learn.microsoft.com/en-us/windows/wsl/install

步骤 3:安装 Docker Engine(WSL 端)

进入 WSL Linux 终端,按照 Docker 官方文档安装 Docker Engine。

  • 官方文档:https://docs.docker.com/engine/install/ubuntu/

步骤 4:安装 NVIDIA Container Toolkit(WSL 端)

  • 官方文档:https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

安装完成后,需要执行如下配置命令:

sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker

4.(可选)局域网访问配置

默认情况下,WSL 使用 NAT 模式,这意味着局域网内的其他设备无法直接访问 WSL 中运行的服务(如 GPUStack Server)。

若需在局域网访问,请使用 "WSL Settings" 工具配置 WSL 网络模式为 "Mirrored",如下图所示

关于 WSL 网络模式的详细信息,请查看微软官方文档:https://learn.microsoft.com/en-us/windows/wsl/networking

5. 部署 GPUStack Server

环境准备就绪后,WSL 即可被视为一个标准的 Linux 环境。

请参考 GPUStack 官方文档进行安装:https://docs.gpustack.ai/latest/installation/installation/

6. 添加 Worker 时的注意事项

在 GPUStack UI 界面中按照引导添加 Worker 时,请务必注意以下两点:

6.1 使用默认用户执行脚本

在执行添加 Worker 的验证脚本时,请使用 WSL 的默认用户执行,不要使用 root 用户

  • 原因:在 WSL 中,nvidia-smi 命令的路径可能未包含在 root 用户的环境变量中,而默认用户可以直接调用。若使用 root 执行,即使环境配置正确,GPU 检测也会失败。

6.2 正确填写 Worker IP

在配置 Worker IP 地址时,请填写 WSL 的实际 IP 地址(例如 172.x.x.x),可使用 ip addr 命令查看。

使用 127.0.0.1 可能导致添加 Worker 失败。

7. 常见问题与注意事项

  • 重启生效:安装 Windows 显卡驱动和 WSL 后通常需要重启 Windows 系统;安装 NVIDIA Container Toolkit 后需重启 WSL 中的 Docker 服务。
  • WSL 局限性:尽管 NVIDIA 对 WSL 的支持已非常完善,但仍有极少数特定场景可能存在兼容性差异。如遇未知错误,建议搜索 "WSL + [具体错误信息]" 获取解决方案。
  • 组件角色:本指南主要解决 GPU 算力供给(Worker)的问题。对于 GPUStack Server(管理端),由于其主要通过网络通信,对 GPU 依赖较小,部署位置相对灵活,但在 WSL 中统一部署管理更为方便。

GPUStack 更多信息

开源地址:https://github.com/gpustack/gpustack

官网文档:https://docs.gpustack.ai/

GPUStack v2 FAQ:https://p0p8qa0c0s.feishu.cn/wiki/U3rfw356JitxN3kQeyOcrabInAg

欢迎加入社区群交流

如果二维码失效,大家可前往 GPUStack 项目获取最新入群二维码 https://github.com/gpustack/gpustack/blob/main/docs/assets/wechat-group-qrcode.jpg

http://www.jsqmd.com/news/159372/

相关文章:

  • 2025年金山附近优秀的家装工作室有哪些,法式软装设计/法式室内设计/新中式软装设计/新中式精装房设计,家装工作室有哪些 - 品牌推荐师
  • 【2025年推荐】NanoBananaPro 生图|如何用 poloapi.top 中转一键调用 - poloapi-ai大模型
  • TinyMCE5支持信创系统excel数据绑定功能
  • Pinia 实战:志愿填报系统全局数据管理核心流程
  • 2025年热门的电缆硅橡胶厂家最新热销排行 - 品牌宣传支持者
  • vue3大文件上传组件的信创环境适配与优化
  • 国产沐浴露十大品牌推荐!女性痘肌专用款,长青泉中药植萃,控油祛痘获权威认可 - 博客万
  • 2025年长三角屏蔽袋优质服务厂家排名:镀铝屏蔽袋厂家TOP5推荐 - myqiye
  • 元旦节直播物料如何筹备?现成模板+必选道具,直接抄作业
  • PyTorch-CUDA镜像对建筑能耗模拟的帮助
  • PyTorch-CUDA镜像能否运行LangChain框架
  • 2025年口碑不错的气体探测器正规供应商推荐,气体探测器实力厂商全解析 - mypinpai
  • 中国企业级Gemini接口选型:高并发与大规模场景下的服务商推荐 - 智造出海
  • 2025年靠谱SAP系统服务商年度排行榜:外贸行业SAP系统品牌公司与维护推荐 - 工业设备
  • GraphRAG实战:知识图谱+本体论打造更智能的AI系统(建议收藏)
  • html大文件上传插件的加密存储原理与思路
  • PyTorch-CUDA镜像能否部署在Jetson设备上
  • 智能体工程进阶:论“降级设计”的核心——任务再抽象与策略空间扩展
  • Spring IoC 与 DI 核心原理学习笔记(根据黑马课程ssm笔记总结)
  • 2025年比较好的聚脲美缝剂实力厂家TOP推荐榜 - 品牌宣传支持者
  • PyTorch-CUDA-v2.7镜像在学术研究中的应用前景
  • 2025远程联网门禁专业厂家TOP5权威推荐:宿舍联网门禁制造商甄选指南 - 工业品牌热点
  • 【必收藏】大模型领域六大类岗位详解+系统学习路径,附免费资源,小白也能入行AI
  • 防脱洗发水排行榜口碑最好的十款!哪款洗发水防脱最靠谱?第一名无硅油中药配方更安心 - 博客万
  • 中央空调西门子1200PLC与TP900触摸屏模拟仿真T124,带视频,博途V15.1
  • 电脑扬声器没声音显示驱动异常怎么办?深度解析与提供两种修复方案
  • PyTorch-CUDA镜像在音乐生成创作中的可能性
  • 超高分子量聚乙烯含硼板生产商哪家好?售后好的加工厂推荐 - 工业品牌热点
  • 2025年热门的展馆展厅设计品质实力榜 - 品牌宣传支持者
  • 2025年无线门禁系统品牌商排名:宿舍门禁系统品牌推荐 - 工业设备