当前位置：首页 > news >正文

Windows本地AI新玩法：Docker Compose一键部署Ollama与Open WebUI，小白也能玩转私有大模型

news 2026/4/15 6:32:18

1. 为什么要在Windows上部署本地大模型？

最近两年AI技术发展迅猛，各种大语言模型层出不穷。但很多朋友可能都有这样的困扰：每次想用AI都得联网，还得担心隐私问题。其实现在完全可以在自己的Windows电脑上搭建一个私有大模型，就像装个普通软件一样简单。

我最近实测了一套方案，用Docker Compose一键部署Ollama和Open WebUI，整个过程不到10分钟就能搞定。最让我惊喜的是，这套方案对小白特别友好，不需要懂Linux命令，也不需要配置复杂的环境。你只需要会点鼠标、复制粘贴几行命令就行。

本地部署大模型有三大优势：

隐私安全：所有对话数据都留在自己电脑里，不用担心敏感信息外泄
离线可用：没有网络也能用，出差坐高铁时照样能问AI问题
定制自由：可以随意切换不同模型，调整参数，打造专属AI助手

2. 准备工作：安装Docker Desktop

2.1 下载安装Docker Desktop

首先要去Docker官网下载Docker Desktop for Windows。建议选择稳定版(Stable)，下载完成后直接双击安装包，一路点击"下一步"就行。

安装过程中有个关键选项要注意：记得勾选"Use WSL 2 based engine"。这是Windows上运行Docker的最佳方式，性能更好。其他选项保持默认即可。

提示：安装完成后建议立即修改镜像存储位置，避免占用C盘空间。打开Docker Desktop设置，在Resources -> Advanced里修改Disk image location到其他分区。

2.2 理解Docker和WSL2的关系

很多新手会对Docker和WSL2的关系感到困惑，这里用大白话解释下：

Docker：就像个魔法箱子，能把软件和它的运行环境打包在一起，避免污染你的主系统
WSL2：是微软开发的Linux子系统，让Windows也能原生运行Linux程序

Docker Desktop默认使用WSL2作为后端引擎，但好消息是你完全不需要手动配置WSL2！Docker已经帮你搞定了一切，你只需要专注于使用Docker本身。

3. 一键部署Ollama和Open WebUI

3.1 创建项目文件夹

建议在D盘或E盘新建一个文件夹，比如D:\ai-assistant。这个文件夹将存放所有配置文件和模型数据。

文件夹结构应该是这样的：

D:\ai-assistant ├── docker-compose.yml # 配置文件 ├── models/ # 模型存储目录 └── webui-data/ # Web界面数据

3.2 编写docker-compose.yml

在项目文件夹里新建一个docker-compose.yml文件，用记事本或VS Code打开，粘贴以下内容：

version: '3.8' services: ollama: image: ollama/ollama:latest container_name: ollama ports: - "11434:11434" volumes: - D:\ai-assistant\models:/root/.ollama restart: unless-stopped open-webui: image: ghcr.io/open-webui/open-webui:main container_name: open-webui ports: - "3000:8080" environment: - OLLAMA_BASE_URL=http://ollama:11434 volumes: - D:\ai-assistant\webui-data:/app/backend/data depends_on: - ollama restart: unless-stopped

这个配置文件做了三件事：

启动Ollama服务（大模型后端）
启动Open WebUI（网页界面）
将数据目录映射到Windows系统，方便管理

3.3 启动服务

打开PowerShell，切换到项目目录：

cd D:\ai-assistant

然后运行：

docker-compose up -d

第一次运行会下载镜像，可能需要几分钟时间。完成后打开浏览器访问http://localhost:3000就能看到Open WebUI的登录界面了！

4. 使用技巧和常见问题

4.1 下载和管理模型

在Open WebUI界面左上角点击"Models"，然后输入你想用的模型名称，比如：

llama3 （Meta最新开源模型）
mistral （轻量但强大的7B模型）
gemma （Google推出的轻量模型）

首次使用某个模型时会自动下载，速度取决于你的网络。我测试下载llama3-8B大约需要15分钟。

4.2 提升使用体验

如果觉得网页响应慢，可以尝试以下优化：

修改docker-compose.yml中的Open WebUI端口映射为3000:8080
确保模型文件存放在SSD硬盘上
给Docker分配更多资源（在Docker Desktop设置中调整）

4.3 常见问题解决

问题1：镜像拉取失败解决：修改Docker镜像源为国内镜像，在Docker Desktop设置中添加：

{ "registry-mirrors": [ "https://docker.mirrors.ustc.edu.cn" ] }

问题2：模型下载慢解决：可以先用迅雷等工具下载模型文件，然后放到models目录下对应位置

问题3：内存不足解决：尝试使用更小的模型，如mistral-7B或gemma-2B

5. 进阶玩法：让AI更智能

基础功能用熟后，你可以尝试这些进阶功能：

5.1 联网搜索

修改docker-compose.yml，在open-webui服务下添加：

environment: - WEBUI_SEARCH_ENABLED=true - WEBUI_SEARCH_PROVIDER=duckduckgo

重启服务后，聊天界面会出现搜索按钮，AI就能联网获取最新信息了。

5.2 记忆功能

通过Open WebUI的"Collections"功能，可以：

上传文档建立知识库
让AI记住对话历史
创建个性化的AI角色

5.3 本地RAG系统

更专业的做法是搭建本地RAG（检索增强生成）系统：

安装Python和ChromaDB（向量数据库）
将你的文档转换为向量存储
让AI在回答时参考你的私有知识库

具体实现需要编写一些Python代码，网上有很多开源项目可以参考。

这套方案我已经在几台不同配置的Windows电脑上测试过，从入门级的i5笔记本到高配游戏本都能流畅运行。最关键的是所有操作都在图形界面下完成，不需要敲复杂的Linux命令。如果你在部署过程中遇到问题，欢迎在评论区留言交流。

查看全文

http://www.jsqmd.com/news/643385/

别再死记硬背了！用MATLAB动画演示，5分钟搞懂2ASK、2FSK、2PSK、2DPSK相干解调区别

CasRel开源可部署价值：替代商业NLP平台，年节省知识图谱构建成本超80%

Wan2.2-I2V-A14B性能测试：对比不同算法下的视频生成速度与质量

光伏发电量计算中的辐照度标准解析与应用

4月15日成都地区攀成钢产无缝钢管(8163-20#;外径20-108mm)现货报价 - 四川盛世钢联营销中心

保姆级教程：用Python 3.6和pymilvus 1.1.0搞定Milvus向量数据库的增删改查

重磅曝光！GPT-6 即将登场

告别两阶段！用单个冻结的ConvNeXt-Large CLIP，7.5倍速搞定开放词汇分割（附代码）

杰理之spi推灯有概率出现不亮灯【篇】

理解CAP定理与BASE理论：分布式系统的理论基础

概率论_深入解析概率公式中的符号：逗号(,)、竖线(|)、分号(；)及其运算优先级

从零到一：基于Vue3、Electron与Vite的现代化桌面应用实战指南

DeOldify图像上色服务部署详解：计算机组成原理视角下的GPU资源分配

Python的__getattribute__方法实现

你的 Vue 3 watchEffect()，VuReact 会编译成什么样的 React？

用Verilog在FPGA上实现一个带超级密码的电子锁（附完整状态机代码）

微信小程序的自驾游资助定制游旅游线路景点评论系统

Redis 慢查询分析与优化策略

从零到一：在M1 MacBook Pro上搭建全栈Java开发环境

LIO-SAM_based_relocalization在KITTI数据集上的轨迹评估与源码解析（一）—————— 重定位模块的架构与实现

AI绘画黑科技：用ControlNet实现线稿自动上色（附Colab笔记本）

C++模板入门：函数与类模板详解

Face3D.ai Pro精彩案例分享：从手机自拍到专业级3D模型的全流程作品集

实时手机检测-通用部署教程：Kubernetes集群中模型服务编排

阿里语音识别模型实战应用：从部署到批量处理录音文件全流程

尖峰神经网络新突破：Q-K注意力机制如何让Transformer在SNNs中高效运行

通义千问3-VL-Reranker-8B显存优化实战：4-bit量化让12GB显卡也能跑

麒麟服务器系统LVM实战：从物理卷到逻辑卷的完整配置指南

从零到一：基于Logisim的电子钟课设全流程拆解

translategemma-27b-it实战教程：结合CSDN文档图示的Ollama图文翻译全流程解析