当前位置: 首页 > news >正文

免费开源AI软件.桌面单机版,可移动的AI知识库,察元 AI桌面版:本地离线知识库的真完全离线 内网无外网装察元AI的拼装步骤

本地离线知识库的真完全离线 内网无外网装察元AI的拼装步骤

政企客户找我们部署察元AI 桌面单机版,最常见的要求是 完全不联外网。chayuan-desktop 在这件事上是天然契合的,因为它本来就是单机优先。但首装那一台仍然需要一些预备工作,这一篇给一份内网无外网的装包流程。

先把场景说清楚。内网无外网的意思是部署目标电脑不能访问公网,连 GitHub、Hugging Face、各家厂商 API 都不能直连。模型供应商必须是内网部署的本地推理服务,模型权重必须从可信镜像拿。这种场景下察元AI 桌面单机版的优势是数据全本地,但首装依赖准备要做扎实。

第一步,准备物料清单。在一台有外网的中转机上把所有要带过去的东西拉齐。物料包括:chayuan-desktop 安装包(按目标 OS 选 msi/dmg/deb);操作系统依赖包(Linux 上的 webkit2gtk、libssl3 等 deb);模型权重(bge-m3-onnx、RapidOCR、bce-reranker-base 三套);本地推理服务安装包(Ollama 或 vLLM)和模型权重(比如 qwen2.5-7b、deepseek-7b)。

第二步,打包成离线介质。所有文件放到一块加密 U 盘或者光盘镜像,做完整性校验(每个文件配 sha256),按介质交接给目标电脑现场。这种交接在 等保合规 场景里通常有专门 SOP,要走资产审批和介质入库。

第三步,目标电脑上装系统依赖。Linux 上 dpkg -i 或者 rpm -i 装 webkit2gtk、libssl3、libgtk-3-0、libsqlite3-0 这些。Windows 上装 WebView2 Runtime(如果系统没自带)。macOS 上一般不需要装额外依赖。

第四步,装 chayuan-desktop 本体。msi/dmg/deb 装上,目标目录默认即可。

第五步,跳过 FirstRunSetup 的预下载。首启动向导第三屏问要不要下载嵌入模型权重。无外网环境点跳过,直接进主界面。然后退出 chayuan-desktop。

第六步,把模型权重拷进 CHAYUAN_ROOT/models 对应目录。具体子目录结构在仓库 packaging 文档里有列。一般包括 embeddings/bge-m3-onnx、ocr/rapid-ocr、reranker/bce 三个子目录,每个目录里有 model.onnx、tokenizer.json 等文件。拷贝完成后再启动 chayuan-desktop,会自动识别已有的权重。

第七步,部署本地推理服务。在内网另一台机器(或者同一台)部署 Ollama 或 vLLM。Ollama 的安装包和模型权重都需要内网镜像。Ollama 装好之后命令行 ollama serve 起服务,监听 11434。把 chayuan-desktop 配置里的 OpenAI 兼容路由 供应商指到 http://内网IP:11434/v1。

第八步,跑通端到端测试。新建对话,问一句话验证模型能跑;拖一份 PDF 进对话窗口,验证 RAG 入库和引用气泡能跑;建一个 folder-sync 知识库,验证持续同步能跑。这三步全过算完整可用。

国产化支持下的内网部署有几个特别点。麒麟 UOS 上的 SELinux 策略可能拦截 sqlite-vec 加载,提前调整策略;龙芯 loongarch64 平台需要专门构建的 chayuan-desktop 二进制;信创清单里的国产厂商接入需要内网部署对应的私有化版本,比如某些国产 LLM 在企业内部署的话钥匙地址变成内网 IP。

无外网部署的几个常见错误。一是没把模型权重拷全,首次嵌入计算失败;二是 OpenAI 兼容路由 地址写错,请求 timeout;三是依赖 deb 没拷全,dpkg -i 报缺包;四是文件系统时间不一致,TLS 证书校验失败。这几条对照排查能解决八成问题。

WPS AI 插件 chayuan-wps 在内网部署时,加载项的安装包跟桌面单机版一并交付。加载项的服务器地址配置成 127.0.0.1:62581 或者本机内网 IP,认证模式选 none。整套链路全在内网里闭环。

完成内网部署之后,免费开源的AI软件 加 本地离线知识库 加 全模型支持 这三件事在政企客户那里就有一份完整的落地方案。所有数据不出域,所有模型在内网运行,所有依赖可审计。

http://www.jsqmd.com/news/799296/

相关文章:

  • 嵌入式系统调试技术:从JTAG到多核同步的实战指南
  • 打破 IT 业务壁垒:基于JiuwenClaw AgentTeam多智能体驱动电商数据飞轮实践,赋能电商数字化转型定义新范式
  • 利用MCP协议与AI实时追踪TikTok趋势,提升内容策略效率
  • 揭秘Java世界中oop-klass模型奥秘之C++眼中的Java类
  • Obsidian代码块美化终极指南:如何让技术笔记瞬间提升专业度
  • 保姆级教程:在Google Colab上用TensorFlow 2.0快速搭建你的第一个ACGAN图像生成器
  • 一名编程小白的从零开始
  • Grok 4.1 Fast 技术深度解析:架构、训练、能力与工程优化
  • 微服务配置管理新思路:轻量级配置中心管理器ccmanager实战解析
  • PowerShell玩转Excel COM对象:从入门到解决‘被呼叫方拒绝’报错
  • 第一篇:只是想说清楚每行代码是由谁执行的,怎样执行的
  • 结构化技能文档实践指南:从规范到团队知识库构建
  • 告别Jira和Trello?我用ONES的Wiki和测试模块重构了团队协作流程
  • 无线IoT系统硬件级时间同步方案设计与优化
  • LSLib:让《神界原罪》和《博德之门3》MOD制作变得高效完整的实用指南
  • niri下的窗口透明问题(wezterm, kitty)
  • AI- RAG笔记02 - Load Chunking
  • 弹性关节四足机器人冲击缓冲与能耗优化【附仿真】
  • 别让单位设置坑了你!Cadence Allegro出Gerber的英制/公制选择避坑指南
  • 嵌入式实时数据显示系统:从架构设计到ESP32实战
  • 我把 K8s 发布事故率从 30% 降到 0,只用对了这 3 个配置
  • 怎么找到你的第一个 good first issue:新手选题比写代码更重要
  • 告别手动出图!用ArcMap数据驱动页面,5分钟搞定乡镇影像图批量导出PDF
  • AI编程助手技能包:samber/cc-skills提升Claude与Cursor专业输出
  • 构建极简代码片段管理器:从命令行工具到开发效率提升
  • linux学习进展 I/O复用函数——epoll详解(ET,IT模式)
  • 市场营销Agent:自动生成内容与投放策略
  • 从零开始学AI:一个面向新手的终极学习指南
  • AWD平台搭建后别忘了这几步:从计分板查看、SSH连接到Flag提交的完整使用手册
  • JPEXS Free Flash Decompiler:Flash逆向工程与SWF反编译的终极解决方案