当前位置: 首页 > news >正文

大模型智能体与MCP(三) 使用ollama本地部署Deepseek R1 32B模型

配置要求

对于DeepSeek-R1 32B (4bit AWQ/GPTQ / 8bit) 的大模型而言,推荐使用24G显存的显卡进行部署,内存推荐32G,硬盘空间建议60G以上,本案例使用i9-13900k+64G+4090 24G进行部署。

ollama安装和模型安装

对于window系统可以直接进入官网进行安装,注意修改模型路径到,模型文件很大默认在C盘,一般放在其他空间充足的位置

对于Linux使用命令行进行安装

# 1. 安装Ollama(已装可跳过) curl -fsSL https://ollama.com/install.sh | sh # 2. 拉取主力模型DeepSeek-R1 32B 4bit ollama pull deepseek-r1:32b # 3. 查看已安装的模型 ollama list # 4. 运行测试 ollama run deepseek-r1:32b

模型命令

  • 删除模::ollama rm 模型名
  • 复制模型(改名):ollama cp 旧名 新名
  • 查看正在运行的模型:ollama ps
  • 停止正在运行的模型:ollama stop 模型名
  • 停止所有模型:ollama stop --all
  • 允许局域网 / 远程访问(Windows 执行一次即可):setx OLLAMA_HOST 0.0.0.0
  • 从 Modelfile 创建自定义模型:ollama create 新模型名 -f Modelfile
  • 显示某个模型的信息:ollama show 模型名
  • 显示模型参数(系统提示词等):ollama show 模型名 --modelfile
  • 查看本地可用模型 API:curl http://localhost:11434/api/tags
  • 对话 API:curl http://localhost:11434/api/chat -d "{\"model\":\"llama3.1:8b\",\"messages\":[{\"role\":\"user\",\"content\":\"你好\"}]}"

调用模型

使用ChatOpenAI调用qwen模型,不需要key,注意base_url为服务器IP地址,ollama默认端口为11434,注意在服务器开放该端口访问,模型全名需要与下载的模型名称一致

llm=ChatOpenAI(model="qwen2.5-coder:14b",base_url=r"http://192.168.2.108:11434/v1",temperature=0)
http://www.jsqmd.com/news/657669/

相关文章:

  • 一区Top/IF 8.3!六大老年数据库联合争议话题,澳门大学博士这篇文章真的赢麻了
  • 从复古游戏到电子墨水屏:聊聊Floyd-Steinberg抖动算法的那些神奇应用场景
  • 终极指南:如何用lunar-javascript构建专业级农历计算应用
  • STM32掉电保护实战:用PVD在断电瞬间保存关键数据(附HAL库代码)
  • ComfyUI ControlNet Aux:30+预处理器的AI绘画精准控制解决方案
  • 【仅限2026Q1有效】SITS2026圆桌推荐:5套可立即嵌入CI/CD的AIGC代码可信性校验工具链(含开源License兼容性清单)
  • 基于SPDConv(空间-深度卷积)-BiLSTM (双向长短期记忆神经网络)多变量时间序列预测
  • 别光刷题了!用这5个真实嵌入式项目片段,检验你的C语言功底到底扎不扎实
  • 图片批量添加满屏文字水印工具:Windows桌面端实操指南
  • 揭秘Rescuezilla:系统恢复领域的瑞士军刀深度解析
  • 手把手调参:sklearn中Isomap的n_neighbors怎么选?用鸢尾花数据集可视化不同k值效果
  • Winhance中文版:3步快速优化Windows系统的完整指南
  • 如何监控AWR数据收集Job_DBA_SCHEDULER_JOBS中的BSLN_MAINTAIN_STATS
  • 让光学钟从实验室走向现实
  • 从保护环设计到势垒调优:Silvaco TCAD仿真肖特基二极管的3个进阶技巧
  • 2026 年优质临安农家乐推荐榜:临安双福居农家乐领衔,精选特色民宿与吃住优选 - 海棠依旧大
  • AI服务P99延迟骤升200ms?SITS2026紧急响应组24小时内定位并修复的1个内核级NUMA调度缺陷
  • 汇率查询接口:提供不可或缺的数据支撑
  • Keil MDK-ARM:巧用INCBIN指令,在汇编中高效嵌入固件资源
  • 镜像视界|Pixel2Geo™+Camera Graph™,激活数字孪生视频孪生空间智能力
  • 2026年人力资本趋势报告
  • YOLO优化|轻量化注意力机制实战对比
  • PhotoGIMP:Photoshop工作流无缝迁移方案与开源图像编辑效率提升指南
  • 2026年垃圾分类AI识别系统全栈实战指南 (附2020+张标注数据集+完整可运行源码+调优手册)
  • 什么int类型里面能插入文字,还不能改字段类型--SQLite 五脏俱全系列 (2)
  • ComfyUI Impact Pack终极指南:5步掌握AI图像增强完整方案
  • 别再死记硬背了!用Python的SciPy和NumPy库,5分钟搞懂三大抽样分布(卡方、t、F)
  • 数据结构复习(第五章):树与二叉树
  • 科捷智能以一站式方案破解汽配行业厂内运输难题
  • 【限时解密】GitHub Copilot Enterprise未公开的3项性能开关:启用后P99延迟下降63%,仅限前500名开发者获取配置清单