当前位置: 首页 > news >正文

llama.cpp 加载qwen模型,在 cherry Studio中使用

https://www.bilibili.com/video/BV14pdcBQE7W/?spm_id_from=333.1391.0.0
https://github.com/ggml-org/llama.cpp/releases
https://modelscope.cn/models/unsloth/Qwen3.6-35B-A3B-GGUF/files

 

下载得到的模型文件:Qwen3.6-35B-A3B-UD-IQ2_M.gguf   10.7G 放到目录 C:\soft\AI\llm_models   内
自定义启动文件(win版):
(1):解压后进入llama目录,新建start.bat 文件【注意回后缀名】
(2):编辑文件 输入 llama-server --host 0.0.0.0 --port 8080 --models-dir 模型存放地址

 

start.bat 

llama-server --host 0.0.0.0 --port 8080 --models-dir C:\soft\AI\llm_models  

 

Cherry studio 自定义 LLM   llama.cpp   使用 Open AI 模式。

 

 

 
http://www.jsqmd.com/news/807729/

相关文章:

  • 国产数据库私有化部署实战:PolarDB for PostgreSQL 免费容器版踩坑记
  • 从Gcode命令到实体模型:3D打印核心指令的实战解析与避坑指南
  • 使用agentify将OpenAPI文档自动化转换为AI代理的完整指南
  • 无需训练即可实现专业级AI换脸:roop-unleashed完整指南
  • 世毫九学派《结语与展望:从这里,走向何方》深度解析(CSDN开源首发版)
  • sequence-window-dedup-algorithm-prompt
  • 大码无缝平角内裤多少钱一条? - 工业品牌热点
  • Ansys Maxwell 三相变压器电感计算(3D 建模全流程)
  • 上海正规渠道考 CPPM 通过率高吗 - 中供国培
  • Arm Cortex-R52 ETMv4.2实时调试架构详解
  • Lovable Serverless平台落地实战(从Lambda冷启动焦虑到全链路可观测性闭环)
  • Waymo与Cruise旧金山Robotaxi竞赛:技术路径、数据表现与商业化挑战
  • 东莞黄金回收避坑技巧,收的顶正规平台有保障 - 奢侈品回收测评
  • DS4Windows终极指南:在Windows上完美使用PS4手柄的简单教程
  • 从EDA/IP技术路线图看半导体设计演进:系统级、验证与低功耗的十年变迁
  • Arm C1-SME2性能监控与Topdown分析方法详解
  • 上海考一本 CPPM 大概需要多少钱 - 中供国培
  • 北京报考 CPPM 大概多长时间能拿证 - 中供国培
  • 开源AI智能体平台Arkloop:架构解析与实战部署指南
  • 基于AgentScope的HiClaw项目:多智能体协作应用开发实战解析
  • DS4Windows:解锁PlayStation手柄在Windows平台的完整游戏体验
  • iFakeLocation终极指南:深度解密iOS虚拟定位的黑科技实现与实战全攻略
  • Gouache ≠ Watercolor!Midjourney中材质权重冲突导致输出失真的5个致命信号(附实时诊断CLI工具)
  • 北京 CPPM 证书报考收费标准是多少 - 中供国培
  • 如何优化 Shell 脚本中正则匹配的效率?
  • 选购刚性轨道起重机有哪些注意事项? - 工业品牌热点
  • Claude Desktop插件目录架构解析与开发实践指南
  • Chrome悄悄在你电脑里藏了4GB AI模型,删了还会自动重下(附禁用教程)
  • 2026年远程控制软件实测:普通用户别被参数带偏,这三点才是关键 - 博客万
  • VoltAgent实战:从零构建可观测、可扩展的AI智能体工程平台