当前位置：首页 > news >正文

Ollama 快速上手

news 2026/7/5 7:25:07

文章目录

1.简介
2.为什么需要 Ollama？
3.核心特性
4.快速上手示例
5.常见模型资源参考
6.与其他工具的关系
参考文献

1.简介

Ollama是一个开源的、轻量级的本地大语言模型运行平台。

你可以把它理解为大模型时代的 Docker，一个让你能在自己的电脑上一键下载、安装并运行各种开源大模型（如 Llama、DeepSeek、Gemma、Phi 等）的工具，无需依赖云端 API，也无需复杂的 GPU 环境配置。

它最核心的价值在于：让 AI 模型从“云端的服务”变成“本地的一个程序”。从此，数据和隐私完全掌握在自己手里，也不用为每次 API 调用付费。

2.为什么需要 Ollama？

以往想在本地跑一个模型，你需要搞定：CUDA 驱动、Python 环境、PyTorch/TensorFlow、模型权重下载、显存优化……过程繁琐，对非技术人员极不友好。

Ollama 把这一切复杂流程封装成了一条命令，真正做到了“开箱即用”。

3.核心特性

特性维度	说明
极简部署	提供跨平台安装包（Windows/macOS/Linux），一条命令即可下载并运行模型，无需手动配置 Python 环境或 CUDA。
模型丰富	内置模型库支持主流开源模型，如 Llama 系列、DeepSeek-R1、Mistral、Gemma、Phi-4、Qwen 等，可通过`ollama run <模型名>`一键拉取。
硬件兼容	支持 CPU 推理，也自动利用 NVIDIA GPU（CUDA）、AMD GPU（ROCm）及 Apple Silicon（Metal）进行硬件加速。
API 服务	运行后自动启动 RESTful API 服务（默认端口`11434`），供其他应用（如 LangChain、Chatbot UI）调用，方便集成到自己的项目中。
可定制	支持通过`Modelfile`自定义系统提示词、参数（温度等）或导入 HuggingFace 上的 GGUF 格式模型。

4.快速上手示例

1. 安装

Windows/macOS: 官网下载.exe或.dmg安装包，双击安装。
Linux: 运行curl -fsSL https://ollama.com/install.sh | sh。

2. 运行模型
打开终端，输入以下命令，Ollama 会自动下载模型并启动对话：

# 运行 DeepSeek-R1 7B 模型ollama run deepseek-r1

等待进度条跑完，就可以直接在终端里和 AI 对话了。

3. API 调用
在模型运行期间，你可以用 HTTP 请求调用它：

curlhttp://localhost:11434/api/generate-d'{ "model": "deepseek-r1", "prompt": "为什么天空是蓝色的？" }'

5.常见模型资源参考

模型	参数规模	推荐配置	运行命令
DeepSeek-R1	7B	8GB+ 内存	`ollama run deepseek-r1`
Llama 3.2	3B	4GB+ 内存	`ollama run llama3.2`
Phi-4	14B	16GB+ 内存	`ollama run phi4`
Gemma 2	2B	4GB+ 内存	`ollama run gemma2:2b`
Mistral	7B	8GB+ 内存	`ollama run mistral`

6.与其他工具的关系

与 OpenAI API 对比：Ollama 是本地运行，完全免费，数据不上传云端，但需要自己有硬件资源；OpenAI 是云服务，按 token 付费，但无需操心硬件。
与 vLLM、llama.cpp 对比：Ollama 封装了 llama.cpp 等底层推理引擎，提供了更友好的用户界面和模型管理能力，对新手更友好。

Ollama 的出现极大地推动了大模型的“民主化”进程，让普通开发者和爱好者也能在自己的电脑上探索前沿 AI 能力。

参考文献

Ollama

http://www.jsqmd.com/news/517630/

相关文章：

Java开发者福音：Spring AI快速搭建AI智能体（珍藏版实战指南）

2026年全国口碑好的SCI论文润色机构推荐，专业服务与售后全解析 - 工业品牌热点

告别龟速！用HF_ENDPOINT和HF_TRANSFER加速下载HuggingFace数据集（附完整命令）

从原理到应用：全面解析二极管、三极管、晶闸管、MOS管与IGBT的核心差异

ThinkPHP 8.x 开发者必看：Swoole加速的5个常见坑及解决方案

ESP8266 Wiegand协议库：高可靠RFID读卡器驱动实现

2026阳光房优选攻略：口碑公司让家更添光彩，阳光房推荐精选实力品牌 - 品牌推荐师

保姆级避坑指南：用DDPM生成CIFAR-10图像时，你的损失函数和采样流程可能都错了

别再被oem.inf文件困扰了！5分钟搞定Visual C++运行库缺失问题

别再自己搭XSS平台了！这个在线工具（d00.cc）5分钟搞定钓鱼测试和弹窗监控

kkFileView vs 阿里云OSS预览：自建文件预览服务的成本与性能对比（含Docker实战）

Pic Kit3.5仿真器的自动烧写功能在嵌入式开发中的高效应用

保姆级教程：用DJI Assistant 2搞定无人机连接电脑，实时查看高清图传画面

Spring Boot 3.2实战：如何用RestClient轻松替换老旧的RestTemplate（附完整代码示例）

超越西方中心主义：科学知识的认识论霸权与多元现代性重构

Chrome用户必看！Cent浏览器这些隐藏功能让你效率翻倍（手势/拖拽/标签页全解析）

嵌入式系统中的数据驱动编程实践

西方中心主义批判与全球知识生产体系重构：一项多维度学术分析

java毕业设计基于springboot新闻发布管理系统project68965

【UG/NX二次开发】高效导出STEP文件的自动化实践

城市经济联系可视化：ArcGIS中经济引力模型的5个关键步骤与常见问题解决

【生产级部署】基于Docker Compose构建高可用StarRocks数据仓库集群

Element Plus实战：el-upload上传图片后自动隐藏+按钮（附完整代码）

Multisim14数码管仿真：从0到9的完美显示实现

从手机信号到5G基站：一文看懂SAW滤波器是怎么‘刻’出来的（附工艺流程图解）

VS安装WDK后项目报错？手把手教你安装Spectre缓解库（附VS Installer截图）

InfluxDB查询实战：从基础到高阶的10个必会技巧（附避坑指南）

手把手教你用FIRSTOP和LASTOP集构建算符优先关系表（附完整算法步骤）

[lammps教程]OVITO动态追踪原子扩散路径：从基础操作到科研应用

Cadence Pad Designer实战：5分钟搞定通孔焊盘设计（附常见错误解决方案）