当前位置：首页 > news >正文

Ollama 简介

news 2026/5/15 6:25:00

Ollama 简介

Ollama 是一个开源的本地大语言模型运行框架，旨在简化大模型在本地环境的部署和使用。

核心特点

本地运行：模型完全在本地机器上执行，数据不出本机，保障隐私安全
简单易用：一条命令即可下载并运行模型，无需复杂配置
模型丰富：支持 Llama、Gemma、Mistral、Qwen、DeepSeek 等主流开源模型
轻量高效：针对消费级硬件优化，普通电脑即可运行

基本用法

# 安装后运行模型（自动下载）ollama run llama3# 拉取模型ollama pull qwen2# 查看已下载模型ollama list# 删除模型ollamarmllama3

API 接口

Ollama 启动后默认在http://localhost:11434提供 REST API，兼容 OpenAI API 格式：

# 生成补全curlhttp://localhost:11434/api/generate-d'{ "model": "llama3", "prompt": "Hello" }'# 对话补全curlhttp://localhost:11434/api/chat-d'{ "model": "llama3", "messages": [{"role": "user", "content": "Hello"}] }'

也可通过 SDK 集成：

// Node.jsimport{Ollama}from'ollama';constollama=newOllama();constresponse=awaitollama.chat({model:'llama3',messages:[{role:'user',content:'Hello'}],});

# Pythonimportollama response=ollama.chat(model='llama3',messages=[{'role':'user','content':'Hello'}],)

Modelfile 自定义

Ollama 支持通过 Modelfile 创建自定义模型，类似 Dockerfile：

FROM llama3 PARAMETER temperature 0.7 SYSTEM You are a helpful coding assistant.

ollama create my-model-fModelfile

适用场景

场景	说明
隐私敏感应用	数据不离开本地
离线环境	无需网络即可使用
开发测试	快速验证模型效果
成本控制	无 API 调用费用
RAG 应用	结合本地知识库构建问答系统

支持平台

macOS
Linux
Windows

Ollama 降低了使用大语言模型的门槛，让开发者和用户无需依赖云端服务，即可在本地体验和集成大模型能力。

http://www.jsqmd.com/news/820050/

相关文章：

掌握Windows虚拟显示技术：ParsecVDisplay打造高效多屏工作环境

3分钟实现Figma中文界面：设计师必备的高效本地化工具

Python异步爬虫框架lightclaw：轻量级高并发网页数据采集实战

ESP32双模蓝牙键盘实现攻略

2026大模型学习路线：从零基础到实战落地，少走2年弯路

MGO空间管理面板正式开源：一款为新手而生的极简PHP面板

广州游乐设备厂家2026年市场趋势与选型分析

基于Arduino与DFPlayer Mini打造可编程声音反馈键盘

AI应用开发脚手架：基于Next.js与LangChain的快速原型构建指南

DMRG-SCF方法：量子化学强关联系统的高效计算方案

100人以内中小医疗企业，如何将诊疗沟通的医疗录音转换成可落地行动项？

2026年4月服务好的佛手苗种植企业推荐，四叶参小苗/金果榄种子/草珊瑚种苗/枳壳种子/通草苗，佛手苗培育基地口碑推荐 - 品牌推荐师

2026年4月有实力的不锈钢法兰公司推荐，不锈钢折弯/不锈钢毛细管/不锈钢方管/不锈钢激光切割，不锈钢法兰厂家哪个好 - 品牌推荐师

VSCode自动化进阶：用vscode-control实现编辑器深度定制与工作流优化

【收藏备用】2026年，程序员小白必看！尽快学Agent，真的太紧迫了

Git 提交签名 verification failed 怎么配置 GPG 密钥

ARM TLB指令解析与性能优化实践

VLA模型太慢？我们把视觉token砍到16个，机器人成功率反而暴涨52.4%｜ICML 2026 GridS源码解读

工程化AI编程：claude-code-blueprint项目实战与最佳实践

AI收入占比首破30%，AI驱动的阿里有何不同？

液冷下半场：两相液冷比拼的不仅是冷板厚度，还比什么？

基于CircuitPython与Adafruit IO构建本地物联网仪表盘

上海市第一人民医院放射科张佳胤教授等团队：基于CT心肌灌注影像组学模型预测主要不良心血管事件的开发与验证

Llama 3专用JavaScript分词器：原理、API与实战指南

Prisma Relay游标分页库实战：解决GraphQL分页难题

神经网络原理第八章：主分量分析

开源集成利器OpenClaw：深度连接Bitrix24与外部系统的PHP解决方案

ARM内存管理：MMU与GPT原理及应用解析

10亿条URL的黑名单，如何快速判断一个新请求的URL是否在黑名单内？

别再优化传统SEO了！2026年AI搜索排名核心因子突变——5大隐性信号（用户意图蒸馏度、上下文保真率、推理链可溯性）全曝光