当前位置: 首页 > news >正文

ollama常用命令

Ollama 的核心命令可以分为三类:服务管理、模型管理和模型运行。掌握这些命令,你就能轻松在本地部署和运行大语言模型了。

🎯 核心命令列表及使用说明

类别命令格式说明使用示例
服务管理ollama serve启动 Ollama 的后台服务。当你需要手动启动服务或更改配置时使用。ollama serve
ollama -v查看当前安装的 Ollama 版本。ollama -v
模型管理ollama pull <model_name>从模型仓库下载模型到本地。ollama pull llama3.2
ollama listollama ls列出所有已下载到本地的模型。ollama list
ollama rm <model_name>删除本地指定的模型,以释放磁盘空间。ollama rm llama3.2
ollama show <model_name>显示指定模型的详细信息,如参数、配置等。ollama show llama3.2
ollama cp <source_model> <dest_model>复制一个已存在的模型,创建一个新副本。ollama cp llama3.2 my-llama
ollama create <new_model> -f <Modelfile>通过一个Modelfile配置文件来创建自定义模型。ollama create my-model -f ./Modelfile
ollama push <model_name>将你本地的模型推送到远程仓库(如 Ollama Hub)。ollama push my-username/my-model
模型运行ollama run <model_name>运行一个模型。如果模型不存在,会先自动下载再运行。ollama run llama3.2
ollama run <model_name> "<prompt>"以非交互模式运行模型,直接输入提示词并获取结果。ollama run llama3.2 "Explain AI"
ollama ps查看当前正在运行中的模型及其状态(如显存占用、上下文长度)。ollama ps
ollama stop <model_name>停止一个正在运行的模型,以释放系统资源。ollama stop llama3.2

📝 高级使用技巧与配置

除了基础命令,灵活运用以下技巧能让你更高效地使用 Ollama:

  • 交互模式:在ollama run启动的对话中,可以使用一些斜杠命令辅助操作,例如输入/bye退出对话,或输入/help查看所有聊天命令 。

  • 多行输入:在交互模式下,输入"""(三个双引号) 然后按回车,即可开始输入包含换行符的长文本,再次输入"""并回车即可提交 。

  • 直接传入文件:在非交互模式下,可以用重定向让模型读取文件内容,非常适合总结长文档。例如:

    ollama run llama3.2"Summarize this text:"<my_long_article.txt
  • 保存输出到文件:使用>重定向,将模型的回答直接保存到文件中。

    ollama run llama3.2"Write a haiku about AI">ai_haiku.txt
  • 多模态模型:如果你运行的是支持图像识别的模型(如llava),可以在提示词后直接附上图片路径,让模型“看图说话”:

    ollama run llava"What's in this image?"/path/to/your/image.jpg
  • 修改模型存储路径:默认情况下,模型文件会保存在系统盘。你可以通过设置环境变量OLLAMA_MODELS来修改存储路径,避免占满C盘空间 。

  • 启动时的参数调优:在启动 Ollama 服务时,可以设置环境变量来调整运行参数。例如,设置OLLAMA_CONTEXT_LENGTH=64000来增大模型的上下文窗口(注意这会消耗更多显存)。

如果想了解如何创建自定义模型或进行更详细的API调用,可以随时再问我。

http://www.jsqmd.com/news/601409/

相关文章:

  • A*算法与Matlab路径规划:自定义地图与Astar走迷宫
  • AI视频增强效率提升指南:用Video2X实现视频质量优化的全流程方案
  • 3种高效方案解决Kindle电子书封面不显示问题
  • 3分钟学会在Blender中安装和使用VRM插件:从零到精通完整指南
  • 突破网盘限速的5个秘诀:8大平台直链下载工具全解析
  • 在物联网应用中使用 MQTT 而不是 HTTP?
  • Recaptcha2 图像识别 API 集成指南
  • 5大核心功能驱动管理工具:DriverStore Explorer高效清理与深度优化指南
  • OpenAI GPT-Image-2 泄露:世界知识与文字渲染的重大飞跃
  • 基于cv_unet_image-colorization的老电影修复案例:4K彩色化效果展示
  • GLM-4.7-Flash新手教程:Ollama命令行与Web UI双模式体验
  • 【读书笔记】《芒格之道》
  • 科研党福音:OpenClaw+千问3.5-9B自动整理参考文献
  • 5步构建炉石传说自动化系统:开源工具让日常任务效率提升500%
  • 保姆级教程:用R包ggClusterNet一键搞定微生物网络分析,从数据到Zi-Pi图全流程
  • 告别手动!用IP-Guard域脚本工具,三步搞定全公司客户端的静默安装
  • Seed-Coder-8B-Base案例分享:这些实用代码片段都是AI写的
  • 高德集成闪退问题
  • SpringBoot安全认证授权机制:Spring Security+JWT+RBAC权限控制
  • 别再手动拼接Prompt了!用AutoGen的AssistantAgent打造你的第一个智能助手(附完整代码)
  • Python通达信数据获取终极指南:mootdx让金融数据分析更简单
  • 基于SiameseAOE的智能客服系统:用户意图与情感实时分析
  • claw-code 源码分析:Tool Pool 组装——默认策略、过滤、MCP 开关如何影响「可用工具面」?
  • 双系统党的福音:用efibootmgr命令彻底解决Windows和Linux启动顺序冲突
  • 如何让《鸣潮》突破硬件限制?WaveTools开源工具的三大核心解决方案
  • 3个技术突破实现抖音直播实时数据采集与分析
  • 黑客马拉松利器:OpenClaw+SecGPT-14B快速构建安全PoC
  • OpenClaw安全防护指南:千问3.5-27B执行权限管控策略
  • WeChatExporter革新性全流程指南:无需越狱完整导出iOS微信聊天记录
  • Tailscale子网路由进阶玩法:用CM311-1a-YST实现跨运营商内网互访(Armbian环境)