当前位置: 首页 > news >正文

[智能体-24]:ollama运行deepseek大模型的方法示例

下面给你一套完整、可直接照着做的示例:用 Ollama 安装并运行 DeepSeek(R1 推理版 / Coder 代码版),包括命令行、API、WebUI、离线导入四种方式,以及常见坑的处理。


一、先确认:Ollama 里有哪些 DeepSeek 可用

主要两大类:

  • deepseek-r1:通用 + 推理强(数学 / 逻辑 / 解题)
    • deepseek-r1:1.5b≈1.1GB,低配也能跑
    • deepseek-r1:7b≈4.7GB,主流显卡(6GB+)
    • deepseek-r1:8b≈5.2GB,推荐日常用
    • deepseek-r1:14b≈8–12GB,建议 16GB 显存
  • deepseek-coder:代码专用
    • deepseek-coder:6.7b

新手推荐:deepseek-r1:8b(平衡速度 / 效果 / 资源)


二、方式 1:命令行直接运行(最简单)

1)安装 / 启动 Ollama(已装可跳过)

  • Windows:官网下载安装包,安装后自动后台运行
  • macOS:

bash

运行

brew install ollama ollama serve
  • Linux:

bash

运行

curl -fsSL https://ollama.com/install.sh | sh sudo systemctl start ollama sudo systemctl enable ollama

2)拉取 DeepSeek 模型

bash

运行

# 推荐:8B 通用推理版 ollama pull deepseek-r1:8b # 低配/测试:1.5B ollama pull deepseek-r1:1.5b # 代码专用 ollama pull deepseek-coder:6.7b

3)运行并对话

bash

运行

ollama run deepseek-r1:8b

出现>>>即可聊天:

plaintext

>>> 用数学方法解释为什么 0.999... = 1 >>> 写一个 Python 快速排序

退出:/bye

4)常用管理命令

bash

运行

ollama list # 查看已下载模型 ollama ps # 查看正在运行的模型 ollama stop deepseek-r1:8b # 停止模型 ollama rm deepseek-r1:8b # 删除模型

三、方式 2:REST API 调用(程序 / 脚本用)

Ollama 默认开11434端口,兼容 OpenAI 格式。

1)curl 示例

bash

运行

curl http://localhost:11434/api/chat -d '{ "model": "deepseek-r1:8b", "messages": [ {"role": "user", "content": "解释一下什么是大语言模型"} ], "stream": false }'

2)Python 示例

python

运行

import requests url = "http://localhost:11434/api/generate" payload = { "model": "deepseek-r1:8b", "prompt": "用Python写一个斐波那契函数", "stream": False } res = requests.post(url, json=payload) print(res.json()["response"])

四、方式 3:WebUI 可视化(推荐日常使用)

Open WebUI为例(功能最全)。

1)Docker 启动 Open WebUI

bash

运行

docker run -d \ -p 3000:3000 \ -v open-webui:/app/backend/data \ --add-host=host.docker.internal:host-gateway \ ghcr.io/open-webui/open-webui:main

2)浏览器访问

打开:http://localhost:3000

  • 首次注册 / 登录
  • 右上角选模型:deepseek-r1:8b
  • 直接对话、保存会话、调整参数

五、方式 4:离线导入 GGUF(解决超时 / 境外下载慢)

适合:网络差、拉取超时、想自己用 GGUF 模型。

1)国内下载 GGUF

去魔搭 ModelScope 或 HF 镜像站,搜索:

  • DeepSeek-R1-Distill-Qwen-8B-GGUF
  • 下载Q4_K_M(平衡速度 / 精度)

2)写 Modelfile

新建文件Modelfile(无后缀):

plaintext

FROM ./DeepSeek-R1-Distill-Qwen-8B.Q4_K_M.gguf PARAMETER temperature 0.6 PARAMETER num_ctx 16384 SYSTEM "你是 DeepSeek 推理模型,擅长数学和代码,回答简洁准确。"

3)本地创建模型

bash

运行

ollama create deepseek-r1:8b-local -f Modelfile

4)运行

bash

运行

ollama run deepseek-r1:8b-local

六、常见问题(国内用户必看)

1)pull 超时 / 慢

  • 用国内镜像:OLLAMA_MIRROR=https://ollama.ac.cn

bash

运行

# Linux/macOS export OLLAMA_MIRROR=https://ollama.ac.cn ollama pull deepseek-r1:8b
  • 或直接用上面 “离线 GGUF 导入” 方法

2)显存不够

  • 优先用1.5B/7B/8B量化版(Q4_K_M)
  • 关闭其他占用显存的程序

3)想做代码专用

bash

运行

ollama pull deepseek-coder:6.7b ollama run deepseek-coder:6.7b
http://www.jsqmd.com/news/870343/

相关文章:

  • 降AIGC黑科技!AI率92%暴降至5%!实测10款降AIGC平台!学生党狂喜!
  • 终极资源下载神器:三分钟快速上手,轻松获取全网视频音频资源
  • CPUDoc终极指南:免费解锁CPU隐藏性能的智能调度神器
  • spring源码bean生命周期篇 五 如何解决循环依赖
  • 从0到1开发filer.js应用:构建一个功能完备的浏览器文件管理器
  • 亲子出游订机票退改怕麻烦?选美团机票更省心 - 博客万
  • Linux基本命令
  • 【保姆级教程】OpenClaw 一键安装包下载与部署操作指南 (含安装包)
  • 2026年宁夏银川GEO优化与AI推广服务商深度横评|精准获客完全指南 - 精选优质企业推荐官
  • 范式披露一季度财报:收入同增35.4%,Token调用量激增近6倍
  • 在Windows上安装安卓应用的终极解决方案:APK安装器深度解析
  • 2026年宁夏AI推广与GEO优化服务商深度横评:银川、石嘴山、中卫企业获客完全指南 - 精选优质企业推荐官
  • 2026年新疆HDPE管道与市政基建工程供应商深度选型指南 - 精选优质企业推荐官
  • Video2X:让模糊视频变清晰的AI魔法工具,完全免费!
  • 福正美上门回收黄金,石家庄实测透明报价不套路 - 上门黄金回收
  • 重庆众申机电设备:重庆发电机租赁公司 - LYL仔仔
  • 【小白专属详细教程】Windows 11 平台 OpenClaw 一键部署完整操作流程(包含安装包)
  • 5分钟极简配置:TrafficMonitor插件生态完全指南
  • 番茄小说下载器:跨平台小说下载终极解决方案
  • 【办公小助手】OpenClaw 对接 DeepSeek 模型配置详细教程(包含安装包)
  • 支持机票灵活退改、免费改期选哪个平台?美团机票省心又划算 - 博客万
  • Yoga Book 9 13IRU8 必看!UserCenter 核心功能全汇总,双屏效率直接拉满
  • 3大实战策略:构建Qwen大语言模型质量保障体系
  • 2026年宁夏企业AI推广与GEO优化完全指南:银川、石嘴山、吴忠、中卫、固原五地获客破局方案 - 精选优质企业推荐官
  • Meta-Typing开发指南:贡献代码与扩展类型函数库
  • 终极AMD处理器性能优化指南:深度掌握Ryzen SDT调试工具
  • Outline开源知识库:如何打造企业级实时协同文档平台的完整指南
  • 青岛兴盛伟业包装:口碑好的青岛沙发翻新公司 - LYL仔仔
  • E5续订程序数据库设计:MySQL与Redis在订阅管理中的应用
  • Linux jstack 与 jmap 命令安装与实战