当前位置：首页 > news >正文

Ollama + LocalCode Windows 本地部署指南：免费打造你的私有 AI 编程助手

news 2026/6/8 9:07:39

前言

你是否遇到过这些问题：

Lingma、Qorder 的免费额度用完了，续费太贵？
公司的代码太敏感，不敢上传到云端 AI？
网速慢、断网时想用 AI 辅助编程？

本地运行 AI 模型是解决这些问题的终极方案。本文将带你从零开始在 Windows 上部署 Ollama + LocalCode，打造一个完全免费、数据不出门、无使用限制的本地 AI 编程助手。

最重要的是，整个过程不需要 GPU，普通办公电脑就能跑。

一、为什么选择这套方案？

对比项	云端 AI（Claude/ChatGPT）	本地方案（Ollama + LocalCode）
费用	订阅制或按 token 收费	完全免费
数据隐私	代码上传到云端	数据留在本地
网络要求	必须联网	可离线使用
使用限制	有额度/次数限制	无限制
模型选择	固定模型	自由切换（1.3B/7B/14B）

二、准备工作

硬件要求

项目	最低要求	推荐配置
操作系统	Windows 10/11	Windows 10/11
内存	8GB	16GB+
硬盘	10GB 可用空间	20GB+
网络	用于下载模型	宽带即可

软件要求

Node.js18 或更高版本 → 下载地址
PowerShell（Windows 自带）

三、安装步骤

第 1 步：安装 Ollama（模型运行环境）

Ollama 是让大模型能在本地运行的核心工具。

访问 https://ollama.com
点击Download，选择Windows版本
运行OllamaSetup.exe完成安装

验证安装：

powershell

ollama --version

第 2 步：启动 Ollama 服务

方法一（推荐）：通过开始菜单启动 Ollama，系统托盘会出现羊驼图标

方法二：命令行启动（需保持窗口打开）

powershell

ollama serve

验证服务是否正常：

powershell

curl http://localhost:11434 # 返回 "Ollama is running" 即成功

第 3 步：下载 AI 模型

这次测试用的：deepseek-coder:latest(1.3B)

powershell

# 🥇 首选推荐（已验证，8GB 内存流畅运行） # 实际是 1.3B 量化版，大小约 776MB ollama pull deepseek-coder:latest # 🥈 进阶模型（需要 16GB+ 内存，能力强） # q4_0 量化版，大小约 3.8GB ollama pull deepseek-coder:6.7b-instruct-q4_0 # 🥉 旗舰模型（需要 32GB+ 内存，质量最高） # 大小约 9GB ollama pull qwen2.5-coder:14b

💡实测经验：deepseek-coder:latest(1.3B) 虽然在标签上叫 “latest”，但实际上是一个轻量级模型，在 8GB 内存的电脑上能流畅运行，日常代码辅助完全够用。如果尝试 6.7B 模型遇到内存不足错误，说明你的内存不足以运行该模型，建议换回 1.3B 版本。

第 4 步：安装 LocalCode（AI 编程助手）

LocalCode 是一个终端 AI 助手，可以读取你的项目代码并与模型交互。

powershell

npm install -g localcode-agent

验证安装：

powershell

localcode --version

四、常见问题与解决方案

🔥 问题 1：Ollama is not reachable

错误现象：

text

✗ Ollama is not reachable.

原因：Ollama 服务没有启动

解决方案：

从开始菜单启动 Ollama
或运行ollama serve并保持窗口打开
运行curl http://localhost:11434确认服务正常

🔥 问题 2：URL 解析错误

错误现象：

text

TypeError: Failed to parse URL from http://localhost:11434:11434/api/chat

原因：配置文件中的 URL 端口重复了

解决方案：

打开配置文件：

powershell

notepad $env:USERPROFILE\.localcode\config.json

将baseURL改为正确的地址：

json

{ "llm": { "provider": "ollama", "model": "deepseek-coder:latest", "baseURL": "http://localhost:11434", "temperature": 0.1 } }

保存文件，重启 LocalCode

🔥 问题 3：模型下载慢

原因：模型文件较大（776MB - 9GB），从海外下载

解决方案：

耐心等待，下载一次即可
选择网络较好的时段（如清晨）

🔥 问题 4：运行卡顿、响应慢

原因：内存不足或使用 CPU 运行

解决方案：

关闭其他占用内存的程序（浏览器、IDE 等）

换用更小的模型：

powershell

ollama pull deepseek-coder:latest # 1.3B，776MB

使用q4_0量化版本（体积更小）

🔥 问题 5：模型下载成功但运行时报内存错误

错误现象：

text

Error: 500 Internal Server Error: llama-server process has terminated: ggml_backend_cpu_buffer_type_alloc_buffer: failed to allocate buffer of size 3642753024 alloc_tensor_range: failed to allocate CPU_REPACK buffer

原因：模型需要 6-8GB 连续内存，你的系统无法提供

解决方案：

换用轻量级模型（推荐）：
powershell
```
ollama run deepseek-coder:latest
```

限制上下文长度：

powershell

ollama run deepseek-coder:6.7b-instruct-q4_0 --num-ctx 1024

增加 Windows 虚拟内存到 16GB 以上：
- 右键"此电脑" → 属性 → 高级系统设置
- 高级 → 性能设置 → 高级 → 虚拟内存更改
- 取消"自动管理"，设置初始和最大为 16384 MB

五、使用指南

启动 LocalCode

powershell

cd C:\你的项目路径 localcode

首次配置连接

启动后输入/connect：

选择Ollama作为 provider
输入地址：http://localhost:11434
选择已下载的模型（推荐deepseek-coder:latest）

常用命令

命令	功能
`/doctor`	检查连接状态
`/model`	切换模型
`/session save 名称`	保存当前对话
`/session load 名称`	加载历史对话
`/clear`	清空聊天
`/exit`	退出

快捷键

快捷键	功能
`Tab`	切换 BUILD/PLAN 模式
`↑`	查看输入历史
`Ctrl+C`	中止/退出

六、实战：用 AI 分析项目写技术博客

工作流

text

1. 进入项目目录启动 LocalCode 2. 分步提问获取素材 3. 人工整合润色 4. 发布博客

提问模板

text

# 第一步：了解项目结构 列出这个项目的目录结构，每个文件夹的主要职责是什么？ # 第二步：分析核心模块 找出项目中最核心的3个模块，分别解释它们的作用 # 第三步：提取技术栈 列出项目使用的所有框架和库，说明各自的用途 # 第四步：找设计亮点 这个项目中有什么独特的设计或实现技巧？ # 第五步：生成博客初稿 基于以上分析，生成技术博客初稿

模型选择指南（实测版）

你的内存	推荐模型	实际大小	实测状态	响应速度	质量
4GB-8GB	`deepseek-coder:latest`	776 MB	✅ 已验证可运行	很快	够用
16GB	`deepseek-coder:6.7b-instruct-q4_0`	3.8 GB	⚠️ 可能需调整虚拟内存	中等	良好
32GB+	`qwen2.5-coder:14b`	~9 GB	未验证	较慢	优秀

七、效果验证

运行/doctor后看到以下输出即表示部署成功：

text

✓ Ollama is reachable ✓ Model deepseek-coder:latest is available

然后提问测试：

text

>>> 用Python写一个快速排序算法

如果能返回正确的代码，说明一切正常！

八、总结

优点

✅完全免费：无任何 API 费用
✅数据隐私：代码从不离开本地
✅无使用限制：想问多少问多少
✅离线可用：没网也能用

缺点

⚠️硬件要求：需要 8-16GB 内存
⚠️首次部署：需下载数百 MB 到数 GB 模型文件
⚠️质量上限：1.3B/7B 模型略逊于云端大模型

适合人群

代码敏感不便上传的项目
经常断网或网络不稳定的环境
Lingma/Qorder 免费额度用完的用户
想学习本地 AI 部署的技术爱好者

九、常见问题速查表

问题	解决方案
Ollama 连不上	启动 Ollama 服务，检查托盘图标
URL 解析错误	修改 config.json 中的 baseURL
模型下载慢	耐心等待，或换时间段下载
响应太慢	换`deepseek-coder:latest`轻量模型
内存不足错误	换 1.3B 模型或增加虚拟内存
中文乱码	提示 AI “用中文回答”