当前位置: 首页 > news >正文

如何在本地部署大模型-ollama_(保姆级教程)

一、部署方式选择

部署方式上手难度核心特点适用场景
Ollama命令极简,自动适配环境,自带 API 接口新手日常本地调用、快速测试
LM Studio图形化操作,无需敲代码,兼容 OpenAI 接口不想使用命令行、纯可视化使用
Text Generation WebUI⭐⭐⭐功能齐全,支持模型微调、多种量化格式深度调试模型、个性化参数配置
vLLM⭐⭐⭐⭐推理速度快,高并发性能强搭建对外服务、生产环境部署

大家可以按需自我选择,我的推荐是本地自己玩使用ollama,在企业使用最好用vLLM

二、ollama下载(windows电脑为例)

如果官网能下载就用官网,不能就镜像地址,懂得都懂

  1. 官网地址:https://ollama.com/download
  2. 镜像地址:https://cnb.cool/hex/ollama/-/releases/latest/download/OllamaSetup.exe

注意:后续下载模型一般都好几个G,可以在setting中设置模型下载地址

三、免费开源大模型选择

模型名称推荐版本中文友好商用权限Ollama 下载命令最低显存推荐显存最低内存推荐内存硬件适配选型
通义千问 QwenQwen2:7b/14b★★★★★免费可商用ollama run qwen2:7b
ollama run qwen2:14b
6G
10G
8-16G
16G+
16G
32G
32G
64G
16G 内存选 7b,32G 及以上内存选 14b
智谱 ChatGLMchatglm3:6b★★★★★免费可商用ollama run chatglm3:6b5G6-8G16G32G常规家用内存均可流畅运行
Llama3llama3:8b★★★☆☆个人免费商用受限ollama run llama3:8b6G8-16G16G32G16G 标准内存适配日常使用
DeepSeekdeepseek:7b★★★★☆个人免费商用受限ollama run deepseek:7b6G8-16G16G32G代码推理场景,16G 内存够用
Mixtralmixtral:8x7b★★★☆☆免费可商用ollama run mixtral10G16G+32G64G大内存机型专属,长文本处理优选
Gemmagemma2:9b★★★☆☆个人免费商用受限ollama run gemma2:9b8G12-16G16G32G主流内存配置均可稳定运行
Phi-3phi3:mini★★★☆☆免费可商用ollama run phi3:mini3G4-6G8G16G低配小内存笔记本首选

我是16G内存,下载的是Qwen2:7b,直接在powershell上运行ollama run qwen2:7b

四、使用

选中模型直接对话即可,就可以使用了!!!

地址验证:http://localhost:11434/

五、项目集成(Spring AI框架为例)

  1. pom依赖
<dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><!-- Spring AI Ollama 依赖 --><dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-starter-model-ollama</artifactId><version>1.0.0</version></dependency></dependencies>
  1. yaml配置
spring:application:name:spring-ai-demoai:ollama:base-url:http://localhost:11434chat:model:qwen2:7b
  1. 测试运行
packagecom.example.springaidemo.controller;importorg.springframework.ai.chat.client.ChatClient;importorg.springframework.web.bind.annotation.GetMapping;importorg.springframework.web.bind.annotation.RestController;@RestControllerpublicclassAiController{privatefinalChatClientchatClient;// 自动注入 OllamapublicAiController(ChatClient.BuilderchatClientBuilder){this.chatClient=chatClientBuilder.build();}// 测试接口@GetMapping("/ai")publicStringask(Stringquestion){returnchatClient.prompt().user(question).call().content();}}

六、云端部署(TODO)

http://www.jsqmd.com/news/881639/

相关文章:

  • 2026年想装修?昆明这些性价比超高的装修机构不容错过!
  • Google Earth Pro 2025( 谷歌地图) 安装教程:乱码解决+地图浏览
  • 2026年知名的电单车铝制品/割草机铝制品/台州托车铝制品厂家推荐与选型指南 - 品牌宣传支持者
  • WebDriver协议层原理与稳定性实战指南
  • P15729 [JAG 2024 Summer Camp #2] Add Add Add 题解
  • 2026年口碑好的装载机/耐用省油的装载机优质供应商推荐 - 品牌宣传支持者
  • 10分钟上手asc-tools:昇腾NPU算子开发工具集
  • LOTUS:基于最优传输与元学习的无监督AutoML模型选择框架
  • JMeter接口性能压测全流程:从契约确认到五步归因
  • 2026年4月国内评价高的衬氟法兰转卡盘品牌推荐,衬氟直管/衬氟PTFE快装直管,衬氟法兰转卡盘源头厂家哪家可靠 - 品牌推荐师
  • 2026年口碑好的莱州拖拉机/四驱拖拉机/国四拖拉机稳定供货厂家推荐 - 品牌宣传支持者
  • 2026年评价高的江西PU合成革/江西无溶剂PU合成革/环保PU合成革/箱包PU合成革品牌厂家推荐 - 行业平台推荐
  • 机器学习势函数中局部应力计算:平面方法原理与MACE实现
  • 聊天机器人搭建05
  • 2026年热门的大棚王拖拉机/四轮拖拉机/莱州农用拖拉机精选厂家推荐 - 行业平台推荐
  • 2026年口碑好的英国海外仓仓储服务/英国海外仓退货换标/英国海外仓返修退运实力榜 - 行业平台推荐
  • 2026年比较好的小型装载机/电动装载机/性价比高的装载机/装载机定制加工厂家推荐 - 品牌宣传支持者
  • LSTM在四旋翼无人机轨迹优化中的实践与性能分析
  • 2026年电动夹爪品牌推荐怎么选?适配不同产线抓取作业场景 - 品牌2025
  • 物理信息极限学习机(PIELM):秒级求解移动边界问题的无网格新范式
  • 2026年高效AI论文写作软件全攻略(含新手入门指南)
  • 2026年热门的自动配料上料机/粉末上料机/张家港真空上料机/塑料粒子上料机厂家精选合集 - 行业平台推荐
  • 2026年质量好的宁波到贵州贵阳物流专线/宁波到贵州物流专线/宁波到拉萨物流专线/宁波到青海物流专线哪家速度快 - 品牌宣传支持者
  • 2026年海外留学论文降AI攻略:Turnitin AI检测超标4.8元彻底解决完整方案
  • 西安复古婚纱照怎么选?2026年05月热门公司大盘点,西安婚纱照/西安喜嫁婚纱照,西安复古婚纱照门店求推荐 - 品牌推荐师
  • Ubuntu服务器关机日志取证:四步定位谁在何时关机
  • 机器人夹爪该怎样匹配参数?2026年高适配机器人夹爪品牌精选 - 品牌2025
  • 2026年评价高的水泥上料搅拌车/上料搅拌车/混凝土上料搅拌车/自上料搅拌车罐车源头工厂推荐 - 品牌宣传支持者
  • 2026年降AI后语义失真攻略:过度改写论点跑偏4.8元修复语义同时达标完整方案
  • 2026电爪品牌推荐该如何挑选?贴合工业现场实际使用需求 - 品牌2025