当前位置: 首页 > news >正文

免费开源AI软件.桌面单机版,可移动的AI知识库,察元 AI桌面版:全模型支持的第一个例子 给察元AI挂上Ollama的下午

全模型支持的第一个例子 给察元AI挂上Ollama的下午

很多人对察元AI 桌面单机版的第一个误解是:默认要联网用 OpenAI 的钥匙才能跑。其实并不。chayuan-desktop 的网关层在设计时就把本地推理放在和厂商云一样的位置,这一篇用 Ollama 做演示,说一下完整的接入过程,让本地离线知识库 加 本地大模型 的组合在一台普通电脑上跑通。

为什么先选 Ollama。它把模型权重的下载、运行、API 暴露这三件事都打包了,不用自己折腾 llama.cpp 命令行,也不用自己装 CUDA 工具链。安装包在 ollama.com 拿,一路下一步。装完后命令行运行 ollama pull qwen2.5:7b 把一个国产模型权重拉下来,再运行 ollama serve 起服务,本地的 11434 端口会暴露一个 OpenAI 兼容的接口。

接到 chayuan-desktop。打开主界面右上的设置,进 模型供应商,新建一个 OpenAI 兼容路由的供应商。地址填 http://127.0.0.1:11434/v1,钥匙随便填一个非空字符串,因为 Ollama 默认不校验。点保存,察元AI 会去探测 /v1/models,把 qwen2.5:7b 这条记录拉回来。在对话切换器里就能选到这个本地模型。

第一句对话试一下。问一句日常问题,看看流式输出是否正常、tokens/s 大致多少。我那台 i5 加 16G 的电脑上 7B 模型 CPU 跑大概 6-8 tokens/s,不快但是能用。如果你有显卡,Ollama 会自动用 GPU。

接知识库这一段更值得讲。把一份 PDF 拖进对话窗口,触发一次文档 RAG 入库。chayuan-desktop 默认用的是内嵌的 bge-m3-onnx 嵌入模型,跑在 CPU 上做嵌入计算。重排可以选择跳过或者也走本地。整个 RAG 链路在 sidecar 进程内闭环,模型推理走 Ollama,嵌入走 ONNX,向量库是 sqlite-vec。整套链路里一次外网调用都没有发生。

接下来是想象一下整套组合的好处。第一,模型钥匙不再是必需品,单机版可以彻底不联外网;第二,私有文档完全不出本机;第三,跟 chayuan-wps WPS AI 插件 共用同一份 KB 和模型配置,加载项调起来的对话也走 Ollama,体验一致;第四,等你有了显卡,把模型规模升到 14B 或 32B,整个流程不需要重新走,只需要重新拉一份权重并在 Ollama 里切换。

需要注意几个细节。Ollama 默认会启动后台服务,重启 chayuan-desktop 不会重启它,端口冲突的可能性要排查;Ollama 的模型路径默认在 ~/.ollama,磁盘空间要预留;Ollama 的并发窗口默认有限,一次问答里多 Tab 同时跑会排队,体感上像变慢;Ollama 不支持函数调用 tools 的所有模型,遇到工具调用的对话场景要选合适的模型权重。

如果你已经熟悉 LM Studio、vLLM、Xinference,这套接入方式同样可用,OpenAI 兼容路由是 chayuan-desktop 网关层的统一接入点。差别只在于模型规模和性能,链路本身一致。免费开源的AI软件 加上本地推理,凑成一台真正完全自己掌控的 AI 工作站,最大障碍其实是模型权重的下载,而不是 chayuan-desktop 这一边。下午搞定,剩下的就是拿来用。

http://www.jsqmd.com/news/804673/

相关文章:

  • 如何在Windows电脑上安装安卓应用?APK Installer完整指南
  • 计算机毕业设计 | SpringBoot+vue高校教师电子名片系统(附源码+论文)
  • 厚街婚纱摄影哪家值得推荐:秒杀婚纱摄影全城优选 - 17322238651
  • ImageToSTL:让每一张照片都拥有立体的生命
  • 别再傻傻分不清了!一文搞懂L2范数、欧氏距离和正则化的前世今生
  • 厚街婚礼策划哪家值得推荐:秒杀婚礼策划梦幻缔造 - 13425704091
  • IGFBP-3:出生后血液中关键IGF结合蛋白的生物学功能与临床应用价值
  • 百度文库文档免费下载终极指南:3步快速获取纯净PDF
  • 大连导游依依:七年零投诉背后的职业坚守
  • 如何免费重置JetBrains IDE试用期:完整操作指南
  • FanControl.HWInfo插件终极指南:如何实现精准硬件温度监控与风扇控制
  • AutoDock-Vina完全使用手册:从零开始掌握分子对接技术
  • Perplexity接入JSTOR古籍库的5大隐藏限制:92%研究者至今不知的权限陷阱与绕过方案
  • 科研绘图必备:用Matlab+m_map绘制带省界的中国地图全攻略(含南海九段线shp文件处理技巧)
  • 厚街家政哪家值得推荐:秒杀家政高效靠谱 - 19120507004
  • 车联网数据变现实战:从数据采集到商业应用的全链路解析
  • 2026年广东数字员工选哪家?这份实用选型攻略助你精准抉择
  • 厚街泰式按摩哪家值得推荐:秒杀泰式按摩高端甄选 - 13724980961
  • 厚街情侣酒店哪家值得推荐:秒杀情侣酒店口碑炸裂 - 13724980961
  • 厚街空调维修哪家值得推荐:秒杀空调维修靠谱放心 - 13724980961
  • KLayout开源版图工具:芯片设计的完整解决方案
  • DdddOcr:Python开发者必备的离线验证码识别神器
  • 2026 年北京全屋定制靠谱品牌 TOP 排名及定制家具选型指南
  • 【【202604@——春四月八下教材压强专题】】
  • frameworks改变LCD分辨率,调整显示区域
  • IGFBP3抗体的应用及其生物学背景解析
  • 厚街亲子酒店哪家值得推荐:秒杀亲子酒店环境优美 - 17329971652
  • 儿童蜡笔品牌哪家好?资深从业者拆解选品核心标准 - 得赢
  • 如何高效恢复Adobe ExtendScript二进制文件源代码:Jsxer完整指南
  • 2026 南京考研机构上岸率解析:本土机构核心数据与奇林教育实力分析 - 小艾信息发布