当前位置: 首页 > news >正文

【熟练】客户端命令详解

3.1 run 命令

run命令主要用于运行一个大模型,命令格式是:

ollama run MODEL[:Version] [PROMPT] [flags] 比如,运行通义千问命令: ollama run qwen2:0.5b

[:Version] 可以理解成版本,而版本信息常常以大模型规模来命名,可以不写,不写则模式成latest

ollama run qwen2 等同 ollama run qwen2:latest

[PROMPT] 参数是用户输入的提示词,如果带有此参数则,run命令会执行了输入提示词之后即退出终端,即只对话一次。

[root@bogon ~]# ollama run qwen2:0.5b 您好 您好!有什么问题我可以帮助您? ​ [root@bogon ~]#

[flags] 指定运行时的参数

Flags: --format string 指定运行的模型输出格式 (比如. json) --insecure 使用非安全模,比如在下载模型时会忽略https的安全证书 --keepalive string 指定模型在内存中的存活时间 --nowordwrap 关闭单词自动换行功能 --verbose 开启统计日志信息

例如,在启动时增加 --verbose参数,则在对话时,自动增加统计token信息:

[root@bogon ~]# ollama run qwen2:0.5b --verbose >>> 您好 欢迎光临,我可以为您提供帮助。有什么问题或需要帮助的地方? ​ total duration: 1.229917477s load duration: 3.027073ms prompt eval count: 10 token(s) prompt eval duration: 167.181ms prompt eval rate: 59.82 tokens/s eval count: 16 token(s) eval duration: 928.995ms eval rate: 17.22 tokens/s ​

3.2 show 命令

不用运行大模型,查看模型的信息,与之前所学的/show功能类似。

[root@bogon ~]# ollama show -h Show information for a model ​ Usage: ollama show MODEL [flags] ​ Flags: -h, --help 查看使用帮助 --license 查看模型的许可信息 --modelfile 查看模型的制作源文件Modelfile --parameters 查看模型的内置参数信息 --system 查看模型的内置Sytem信息 --template 查看模型的提示词模版 ​

例如,查看提示词模版:

[root@bogon ~]# ollama show qwen2 --template {{ if .System }}<|im_start|>system {{ .System }}<|im_end|> {{ end }}{{ if .Prompt }}<|im_start|>user {{ .Prompt }}<|im_end|> {{ end }}<|im_start|>assistant {{ .Response }}<|im_end|>

3.3 pull 命令

查询模型名称的网站:https://ollama.com/

从远程下载一个模型,命令格式是:

ollama pull MODEL[:Version] [flags]

[:Version] 可以理解成版本,但在这里理解成大模型规模,可以不写,不写则模式成latest

ollama pull qwen2 等同 ollama pull qwen2:latest

[flags] 参数,目前只有一个--insecure参数,用于来指定非安全模式下载数据

ollama pull qwen2 --insecure

3.4 list/ls 命令

查看本地下载的大模型列表,也可以使用简写ls

[root@bogon ~]# ollama list NAME ID SIZE MODIFIED qwen2:latest e0d4e1163c58 4.4 GB 10 minutes ago deepseek-coder:latest 3ddd2d3fc8d2 776 MB 3 hours ago qwen2:0.5b 6f48b936a09f 352 MB 8 hours ago [root@bogon ~]# ollama ls NAME ID SIZE MODIFIED qwen2:latest e0d4e1163c58 4.4 GB 10 minutes ago deepseek-coder:latest 3ddd2d3fc8d2 776 MB 3 hours ago qwen2:0.5b 6f48b936a09f 352 MB 8 hours ago

列表字段说明:

  • NAME:名称

  • ID:大模型唯一ID

  • SIZE:大模型大小

  • MODIFIED:本地存活时间

3.5 ps 命令

查看当前运行的大模型列表,PS命令没其它参数

[root@bogon ~]# ollama ps NAME ID SIZE PROCESSOR UNTIL deepseek-coder:latest 3ddd2d3fc8d2 1.3 GB 100% CPU About a minute from now

列表字段说明:

  • NAME:大模型名称

  • ID:唯一ID

  • SIZE:模型大小

  • PROCESSOR:资源占用

  • UNTIL:运行存活时长

3.6 rm 命令

删除本地大模型,RM命令没其它参数

[root@localhost system]# ollama ls NAME ID SIZE MODIFIED qwen2:latest e0d4e1163c58 4.4 GB 16 hours ago deepseek-coder:latest 3ddd2d3fc8d2 776 MB 19 hours ago qwen2:0.5b 6f48b936a09f 352 MB 24 hours ago [root@localhost system]# ollama rm qwen2:0.5b deleted 'qwen2:0.5b' [root@localhost system]# ollama ls NAME ID SIZE MODIFIED qwen2:latest e0d4e1163c58 4.4 GB 16 hours ago deepseek-coder:latest 3ddd2d3fc8d2 776 MB 19 hours ago [root@localhost system]#
http://www.jsqmd.com/news/530459/

相关文章:

  • 停用词表避坑指南:为什么你的中文分词效果总不理想?
  • ClearerVoice-Studio在网络安全中的应用:语音加密与认证
  • 别再瞎选了!Vivado 2023.2 综合策略实战:从‘跑得快’到‘布得通’的保姆级避坑指南
  • 量子走私系统架构与检测规避原理的技术解构
  • 如何选择靠谱的装修公司?2026 年装修公司权威科普指南 - 品牌策略主理人
  • 5步突破显卡性能瓶颈:OptiScaler焕新老电脑游戏体验全指南
  • 打卡信奥刷题(3005)用C++实现信奥题 P6221 [COCI 2019/2020 #6] Trener
  • 2026头皮按摩设备采购指南:如何甄选技术型制造商? - 2026年企业推荐榜
  • 还在为降重头疼?试试这些AI辅助工具,打开新世界!
  • GitHub中文界面工具:突破语言壁垒的开源解决方案
  • 避坑指南:HBuilder X真机调试必知的ADB配置细节(支持WiFi连接版)
  • LLM·minimind-预训练
  • 洞见2026:玄奘之路戈壁徒步专业服务商全景解析与适配建议 - 2026年企业推荐榜
  • AcousticSense AI真实案例:民谣与乡村音乐在ViT-B/16特征空间中的聚类效果
  • 基于PHP、asp.net、java、Springboot、SSM、vue3的技术博客系统的设计与实现
  • Tinke终极指南:NDS游戏文件编辑与资源提取的完整解决方案
  • 基于脉振高频电压注入法的永磁同步电机PMSM矢量控制模型 在d轴注入旋转高频电压信号,在q轴进...
  • 代码遗产规划师:在技术断代潮收割焦虑税
  • 终极指南:如何用DiffSynth Studio实现视频到3D骨架的智能转换
  • Chord视频时空分析工具效果展示:动态目标跨帧跟踪可视化案例
  • FigmaCN 技术架构深度解析:现代浏览器扩展本地化方案的设计与实现
  • AI原生应用领域:文本生成的前沿技术揭秘
  • BLE调试工具大比拼:nRF Connect vs BLE调试助手 vs LightBlue,哪个更适合你的项目?
  • OpenClaw七大配置:从SOUL、USER、AGENTS到MEMORY
  • AI审核驱动的IACheck:适老化改造工程检测报告如何实现更细致与可靠的质量把控
  • YapDatabase并发性能优化:如何在多线程环境中实现零阻塞
  • 风速仿真模型中的Sumlink仿真:风机仿真、风电机组模型、变桨控制与最大功率追踪控制,包含四...
  • 打卡信奥刷题(3006)用C++实现信奥题 P6225 [eJOI 2019] 异或橙子
  • 激光雕刻机未来几年,年复合增长率(CAGR)高达12.9%
  • GME-Qwen2-VL-2B-Instruct实操手册:电商详情页首图与卖点文案语义一致性检测