当前位置：首页 > news >正文

[智能体-24]：ollama运行deepseek大模型的方法示例

news 2026/7/13 7:34:12

下面给你一套完整、可直接照着做的示例：用 Ollama 安装并运行 DeepSeek（R1 推理版 / Coder 代码版），包括命令行、API、WebUI、离线导入四种方式，以及常见坑的处理。

一、先确认：Ollama 里有哪些 DeepSeek 可用

主要两大类：

deepseek-r1：通用 + 推理强（数学 / 逻辑 / 解题）
- deepseek-r1:1.5b≈1.1GB，低配也能跑
- deepseek-r1:7b≈4.7GB，主流显卡（6GB+）
- deepseek-r1:8b≈5.2GB，推荐日常用
- deepseek-r1:14b≈8–12GB，建议 16GB 显存
deepseek-coder：代码专用
- deepseek-coder:6.7b

新手推荐：deepseek-r1:8b（平衡速度 / 效果 / 资源）

二、方式 1：命令行直接运行（最简单）

1）安装 / 启动 Ollama（已装可跳过）

Windows：官网下载安装包，安装后自动后台运行
macOS：

bash

运行

brew install ollama ollama serve

Linux：

bash

运行

curl -fsSL https://ollama.com/install.sh | sh sudo systemctl start ollama sudo systemctl enable ollama

2）拉取 DeepSeek 模型

bash

运行

# 推荐：8B 通用推理版 ollama pull deepseek-r1:8b # 低配/测试：1.5B ollama pull deepseek-r1:1.5b # 代码专用 ollama pull deepseek-coder:6.7b

3）运行并对话

bash

运行

ollama run deepseek-r1:8b

出现>>>即可聊天：

plaintext

>>> 用数学方法解释为什么 0.999... = 1 >>> 写一个 Python 快速排序

退出：/bye

4）常用管理命令

bash

运行

ollama list # 查看已下载模型 ollama ps # 查看正在运行的模型 ollama stop deepseek-r1:8b # 停止模型 ollama rm deepseek-r1:8b # 删除模型

三、方式 2：REST API 调用（程序 / 脚本用）

Ollama 默认开11434端口，兼容 OpenAI 格式。

1）curl 示例

bash

运行

curl http://localhost:11434/api/chat -d '{ "model": "deepseek-r1:8b", "messages": [ {"role": "user", "content": "解释一下什么是大语言模型"} ], "stream": false }'

2）Python 示例

python

运行

import requests url = "http://localhost:11434/api/generate" payload = { "model": "deepseek-r1:8b", "prompt": "用Python写一个斐波那契函数", "stream": False } res = requests.post(url, json=payload) print(res.json()["response"])

四、方式 3：WebUI 可视化（推荐日常使用）

以Open WebUI为例（功能最全）。

1）Docker 启动 Open WebUI

bash

运行

docker run -d \ -p 3000:3000 \ -v open-webui:/app/backend/data \ --add-host=host.docker.internal:host-gateway \ ghcr.io/open-webui/open-webui:main

2）浏览器访问

打开：http://localhost:3000

首次注册 / 登录
右上角选模型：deepseek-r1:8b
直接对话、保存会话、调整参数

五、方式 4：离线导入 GGUF（解决超时 / 境外下载慢）

适合：网络差、拉取超时、想自己用 GGUF 模型。

1）国内下载 GGUF

去魔搭 ModelScope 或 HF 镜像站，搜索：

DeepSeek-R1-Distill-Qwen-8B-GGUF
下载Q4_K_M（平衡速度 / 精度）

2）写 Modelfile

新建文件Modelfile（无后缀）：

plaintext

FROM ./DeepSeek-R1-Distill-Qwen-8B.Q4_K_M.gguf PARAMETER temperature 0.6 PARAMETER num_ctx 16384 SYSTEM "你是 DeepSeek 推理模型，擅长数学和代码，回答简洁准确。"

3）本地创建模型

bash

运行

ollama create deepseek-r1:8b-local -f Modelfile

4）运行

bash

运行

ollama run deepseek-r1:8b-local

六、常见问题（国内用户必看）

1）pull 超时 / 慢

用国内镜像：OLLAMA_MIRROR=https://ollama.ac.cn

bash

运行

# Linux/macOS export OLLAMA_MIRROR=https://ollama.ac.cn ollama pull deepseek-r1:8b

或直接用上面 “离线 GGUF 导入” 方法

2）显存不够

优先用1.5B/7B/8B量化版（Q4_K_M）
关闭其他占用显存的程序

3）想做代码专用

bash

运行

ollama pull deepseek-coder:6.7b ollama run deepseek-coder:6.7b

查看全文

http://www.jsqmd.com/news/870343/

降AIGC黑科技！AI率92%暴降至5%！实测10款降AIGC平台!学生党狂喜！

终极资源下载神器：三分钟快速上手，轻松获取全网视频音频资源

CPUDoc终极指南：免费解锁CPU隐藏性能的智能调度神器

spring源码bean生命周期篇五如何解决循环依赖

从0到1开发filer.js应用：构建一个功能完备的浏览器文件管理器

亲子出游订机票退改怕麻烦？选美团机票更省心 - 博客万

Linux基本命令

【保姆级教程】OpenClaw 一键安装包下载与部署操作指南（含安装包）

2026年宁夏银川GEO优化与AI推广服务商深度横评｜精准获客完全指南 - 精选优质企业推荐官

范式披露一季度财报：收入同增35.4%，Token调用量激增近6倍

在Windows上安装安卓应用的终极解决方案：APK安装器深度解析

2026年宁夏AI推广与GEO优化服务商深度横评：银川、石嘴山、中卫企业获客完全指南 - 精选优质企业推荐官

2026年新疆HDPE管道与市政基建工程供应商深度选型指南 - 精选优质企业推荐官

Video2X：让模糊视频变清晰的AI魔法工具，完全免费！

福正美上门回收黄金，石家庄实测透明报价不套路 - 上门黄金回收

重庆众申机电设备：重庆发电机租赁公司 - LYL仔仔

【小白专属详细教程】Windows 11 平台 OpenClaw 一键部署完整操作流程（包含安装包）

5分钟极简配置：TrafficMonitor插件生态完全指南

番茄小说下载器：跨平台小说下载终极解决方案

【办公小助手】OpenClaw 对接 DeepSeek 模型配置详细教程（包含安装包）

支持机票灵活退改、免费改期选哪个平台？美团机票省心又划算 - 博客万

Yoga Book 9 13IRU8 必看！UserCenter 核心功能全汇总，双屏效率直接拉满

3大实战策略：构建Qwen大语言模型质量保障体系

2026年宁夏企业AI推广与GEO优化完全指南：银川、石嘴山、吴忠、中卫、固原五地获客破局方案 - 精选优质企业推荐官

Meta-Typing开发指南：贡献代码与扩展类型函数库

终极AMD处理器性能优化指南：深度掌握Ryzen SDT调试工具

Outline开源知识库：如何打造企业级实时协同文档平台的完整指南

青岛兴盛伟业包装：口碑好的青岛沙发翻新公司 - LYL仔仔

E5续订程序数据库设计：MySQL与Redis在订阅管理中的应用

Linux jstack 与 jmap 命令安装与实战

一、先确认：Ollama 里有哪些 DeepSeek 可用

二、方式 1：命令行直接运行（最简单）

1）安装 / 启动 Ollama（已装可跳过）

2）拉取 DeepSeek 模型

3）运行并对话

4）常用管理命令

三、方式 2：REST API 调用（程序 / 脚本用）

1）curl 示例

2）Python 示例

四、方式 3：WebUI 可视化（推荐日常使用）

1）Docker 启动 Open WebUI

2）浏览器访问

五、方式 4：离线导入 GGUF（解决超时 / 境外下载慢）

1）国内下载 GGUF

2）写 Modelfile

3）本地创建模型

4）运行

六、常见问题（国内用户必看）

1）pull 超时 / 慢

2）显存不够

3）想做代码专用

相关文章：