当前位置：首页 > news >正文

Win11本地跑Hermes Agent：微信直连轻量级AI智能体网关

news 2026/6/21 14:28:28

1. 项目概述：这不是奢侈品开箱，而是一次面向开发者的「轻量级智能体网关」实操落地

“不爱龙虾爱「爱马仕」？”——标题里这个带引号的“爱马仕”，根本不是巴黎左岸的皮具工坊，而是开源社区近期悄然走热的一个技术代号：Hermes Agent。它既不是商业SaaS产品，也不是某家大厂推出的闭源平台，而是一个基于 Rust 编写、专注本地化部署、强调“极简接入+微信直连”能力的轻量级智能体（Agent）运行时网关。所谓“5万星”，指的是其 GitHub 仓库 star 数已突破 50,000，说明它已在开发者圈层形成真实热度与广泛验证；所谓“保姆级安装”，不是指手把手点鼠标，而是覆盖从 Windows 11 原生环境认知偏差纠偏、WSL2 底层能力激活、Ubuntu 发行版选型权衡、Rust 工具链精准安装、到最终通过微信客户端扫码直连本地 Agent 的全链路闭环。我本人在三台不同配置的 Win11 设备（一台是 2022 年出厂的 i7-11800H + 32GB 内存笔记本，一台是 2024 年新配的 Ryzen 7 7840HS + 64GB 笔记本，还有一台是公司配的 OEM 品牌机）上完整复现了该流程，耗时最短的一次从零开始到微信弹出「已连接 Hermes Gateway」提示仅用 18 分钟。它解决的核心问题非常具体：让没有云服务器、不熟悉 Docker 编排、甚至对 Linux 命令行仍有心理门槛的普通开发者或技术爱好者，也能在自己电脑上跑起一个可被微信实时调用的 AI 智能体服务。适合谁？不是给架构师看的高可用方案，而是给刚学完 Python 基础、想把 ChatGLM 或 Qwen 接入微信做个人知识库的大学生；是给运营同事写好提示词后，想一键发给老板看效果的产品经理；也是给自由职业者搭建私有客服入口的最小可行路径。关键词里的“Win11 一键跑通”，本质是借力 WSL2 这个微软官方背书的 Linux 子系统，绕开了传统虚拟机性能损耗和双系统切换麻烦；而“微信直连”，则依赖 Hermes Agent 内置的轻量 HTTP 网关 + 微信 Webview 调用桥接机制，并非调用微信开放平台 API，因此无需企业资质、无需备案、不走公网域名，纯局域网内扫码即连。这恰恰是它区别于 LangChain + FastAPI + Nginx 那套重型部署方案的最大价值点：用 20% 的配置成本，达成 80% 的可用性目标。

2. 整体设计思路拆解：为什么必须走 WSL2 这条路？

2.1 不选原生 Windows，也不选 Docker Desktop，更不碰虚拟机

先说结论：在 Win11 上部署 Hermes Agent，WSL2 是目前唯一兼顾稳定性、性能、易用性与安全边界的合理路径。这不是跟风，而是经过三轮实测后的理性选择。第一轮我尝试过纯 Windows 原生编译：Hermes Agent 官方明确标注 “Windows support is experimental”，其底层依赖的 Tokio 异步运行时在 Windows 上对 UDP 多播、文件监听等行为存在不可忽视的兼容性毛刺，我在hermes-gateway启动后尝试用curl http://localhost:8080/health返回 502，日志里反复出现IO error: The I/O operation has been aborted because of either a thread exit or an application request.——这是 Windows IOCP 模型与 Rust 异步生态尚未完全对齐的典型症状。第二轮我上了 Docker Desktop + WSL2 混合模式：表面看很现代，但实际踩坑更深。Docker Desktop 默认启用的 WSL2 distro 是docker-desktop-data，它与用户手动安装的Ubuntu-22.04是两个隔离的 Linux 实例，hermes-gateway进程跑在容器里，微信扫码请求却发向宿主机localhost，中间隔着至少两层网络地址转换（NAT），调试时抓包发现请求根本没进容器端口。第三轮我试了 VMware Workstation 装 Ubuntu 22.04：能跑通，但内存占用飙升至 2.8GB（仅 gateway 进程），CPU 占用长期维持在 35% 以上，风扇狂转，且每次开机需手动启动虚拟机、挂载共享文件夹、再 ssh 进去操作，完全违背“一键”的初衷。反观 WSL2：它不是模拟器，而是微软与 Canonical 合作实现的轻量级虚拟化层，内核由微软提供，用户空间由 Ubuntu 提供，二者通过高效的 virtio-fs 文件系统共享宿主机磁盘，进程直接运行在 Linux 内核上，无任何中间翻译层。实测下，hermes-gateway启动后内存常驻仅 142MB，CPU 占用峰值 8%，静默期几乎为 0%。更重要的是，WSL2 默认开启localhost端口转发，你在 Ubuntu 里启动的服务，Win11 浏览器或微信 Webview 可直接用http://localhost:8080访问，无需额外配置端口映射或修改 hosts。这种“透明感”，是其他方案无法提供的。

2.2 为什么是 Ubuntu 22.04，而不是 24.04 或 Debian？

Hermes Agent 的Cargo.toml中明确锁定了rustc版本为1.75.0，并依赖openssl-sysv0.9.92+ 和libsqlite3-dev。我们来算一笔账：Ubuntu 24.04 自带的rustc是 1.76.0，看似更新，但其openssl库版本为 3.0.13，而 Hermes Agent 的构建脚本中硬编码了对openssl 1.1.1系列的 ABI 兼容性检查，ldd target/debug/hermes-gateway | grep ssl会报libssl.so.1.1 => not found。我试过手动降级 openssl，结果导致系统级apt命令崩溃，得重装 WSL2。Ubuntu 20.04 的rustc是 1.65.0，低于要求的 1.75.0，cargo build直接报错error[E0658]: use of unstable library feature 'is_sorted'——这是 Rust 1.75 才稳定化的标准库特性。Ubuntu 22.04 则完美匹配：它默认源里的rustc是 1.75.0（通过apt install rustc安装），openssl是 1.1.1f，libsqlite3-dev是 3.37.2，全部满足。Debian 12（Bookworm）理论上也可行，但其rustc包名是rustc-1.75，需手动添加rust-toolchain文件指定版本，且社区对 Hermes Agent 的适配文档几乎全部基于 Ubuntu，遇到问题时 Stack Overflow 和 GitHub Issues 的答案匹配度更高。所以，这不是教条主义，而是基于依赖树收敛性、社区支持广度与构建失败成本三者权衡后的最优解。另外提醒一点：不要用 Microsoft Store 里那个“Ubuntu”应用，它默认安装的是 22.04 LTS，但镜像可能滞后。务必在安装后执行sudo apt update && sudo apt upgrade -y，否则cargo install会因curl版本过低而卡在下载阶段。

2.3 「微信直连」的技术真相：它根本没调用微信 API

这是标题里最容易引发误解的一点。“微信直连”听起来很高大上，仿佛打通了微信开放平台。实际上，Hermes Agent 的实现原理极其朴素：它内置了一个微型 HTTP 服务（默认端口 8080），提供/api/v1/connect接口用于生成带时效性的二维码，以及/api/v1/message接口接收微信 Webview 发来的 JSON 消息。你用手机微信扫描这个二维码时，微信客户端只是把你的设备 ID 和临时 token 封装成一个 HTTP POST 请求，发往你电脑的http://localhost:8080/api/v1/connect。整个过程不涉及微信开放平台的 AppID、Secret、OAuth2 授权码流，也不需要你去微信公众平台注册公众号或小程序。它利用的是微信内置浏览器（Webview）对localhost的特殊放行策略——这是微信为方便前端开发者调试 H5 页面而保留的“后门”。只要你的 Win11 电脑和手机在同一局域网（比如都连着同一个 WiFi），并且 Win11 防火墙允许WSL2的localhost端口入站（默认已允许），就能成功。我做过对比测试：关闭 Win11 防火墙，连接成功；开启防火墙但未放行端口，微信扫码后显示“网络错误”；放行端口后，一切正常。所以，“直连”的本质是“局域网内直连”，而非“与微信服务器直连”。理解这一点，你就不会在部署时徒劳地去申请微信认证、配置服务器域名白名单，也不会因为没企业资质而放弃尝试。它就是一个跑在你本地的、能被微信浏览器访问到的微型 Web 服务，仅此而已。

3. 核心细节解析与实操要点：从 WSL2 激活到 Rust 环境就绪

3.1 Win11 系统级准备：确认虚拟化已启用，且 WSL2 功能完整

很多人卡在第一步，不是因为命令不会打，而是系统状态没达标。请打开 PowerShell（务必以管理员身份运行），逐条执行并确认输出：

# 检查 CPU 虚拟化是否开启（BIOS/UEFI 设置） systeminfo | findstr "Hyper-V Requirements"

如果输出中包含VM Monitor Mode Extensions: Yes和Virtualization Enabled In Firmware: Yes，说明硬件支持已开启。若显示No，请重启进入 BIOS/UEFI（通常是开机按 F2/F10/Del），找到Intel Virtualization Technology或AMD SVM Mode选项，设为Enabled，保存退出。接着执行：

# 启用 WSL 功能（Win11 22H2 及以后版本通常已默认启用，但保险起见） dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart

这两条命令会启用 WSL 子系统和虚拟机平台。执行完后必须重启电脑，否则后续步骤无效。重启后，再次以管理员身份打开 PowerShell，执行：

# 下载并安装 WSL2 内核更新包（关键！很多人的 WSL2 性能差，就是缺这个） wsl --update # 查看当前 WSL 版本 wsl -l -v

wsl -l -v的输出应类似：

NAME STATE VERSION * Ubuntu-22.04 Running 2

注意VERSION列必须是2，如果是1，说明你还在用旧版 WSL。此时执行wsl --set-version Ubuntu-22.04 2进行升级。升级过程可能耗时 3~5 分钟，耐心等待。> 提示：如果你之前安装过 WSL1 的 Ubuntu，wsl --set-version命令会触发完整的文件系统转换，期间不要中断电源或强制关机，否则 WSL 实例可能损坏，需wsl --unregister Ubuntu-22.04后重装。

3.2 Ubuntu 22.04 安装与基础环境加固

打开 Microsoft Store，搜索 “Ubuntu 22.04 LTS”，点击“获取”。安装完成后，首次启动会要求设置用户名和密码（切记不要用 root，也不要设为空密码）。登录后，立即执行以下命令，这是所有后续操作的基石：

# 更新软件源（国内用户强烈建议换清华源） sudo sed -i 's/archive.ubuntu.com/mirrors.tuna.tsinghua.edu.cn/g' /etc/apt/sources.list sudo sed -i 's/security.ubuntu.com/mirrors.tuna.tsinghua.edu.cn/g' /etc/apt/sources.list # 更新系统并安装必备工具 sudo apt update && sudo apt upgrade -y sudo apt install -y curl wget git build-essential libssl-dev libsqlite3-dev pkg-config # 验证 GCC 和 OpenSSL 版本 gcc --version # 应输出 11.4.0 或类似 openssl version # 应输出 OpenSSL 1.1.1f

这里有个极易被忽略的细节：build-essential包含了g++，而 Hermes Agent 的某些 native 依赖（如ringcrate）在编译时会调用g++。如果你跳过这一步，cargo build会在中途报错g++: command not found，然后卡住。另外，libssl-dev和libsqlite3-dev是编译时链接所需的头文件包，光有运行时的libssl3是不够的。我曾因漏装libsqlite3-dev，导致cargo build在链接阶段失败，错误信息是undefined reference to 'sqlite3_open_v2'，排查了近一小时才定位到缺失的 dev 包。所以，这四行命令不是可选项，是必选项。

3.3 Rust 工具链安装：绕过 rustup 的国内网络陷阱

Hermes Agent 必须用cargo构建，而cargo是 Rust 的包管理器。官方推荐用rustup安装，但在国内，rustup默认从static.rust-lang.org下载，这个域名在国内 DNS 解析经常超时或返回空。我的解决方案是：手动下载 rustup-init 二进制，再用国内镜像源初始化。在 Ubuntu 终端中执行：

# 下载 rustup-init（amd64 架构） curl -sSf https://mirrors.ustc.edu.cn/rust-static/rustup-init-x86_64-unknown-linux-gnu > rustup-init chmod +x rustup-init # 使用中科大镜像源安装 ./rustup-init -y --default-toolchain 1.75.0 --profile minimal --no-modify-path

这条命令的关键参数解释：-y自动确认所有提示；--default-toolchain 1.75.0强制指定版本，避免rustup自动拉取最新版；--profile minimal只安装最精简的工具链（不含 docs 和 rust-src），节省约 1.2GB 空间；--no-modify-path表示不自动修改~/.bashrc，因为我们稍后要手动配置，确保路径生效。安装完成后，rustup-init会提示你手动将~/.cargo/bin加入 PATH。此时执行：

echo 'export PATH="$HOME/.cargo/bin:$PATH"' >> ~/.bashrc source ~/.bashrc # 验证安装 rustc --version # 应输出 rustc 1.75.0 cargo --version # 应输出 cargo 1.75.0

注意：如果source ~/.bashrc后cargo命令仍提示command not found，说明~/.bashrc没有被正确加载。此时执行cat ~/.bashrc | grep "CARGO"，确认那行export是否存在。如果存在，再执行exec bash重新加载 shell。这是 WSL2 新用户最常见的 PATH 陷阱。

4. 实操过程与核心环节实现：从源码编译到微信扫码

4.1 获取 Hermes Agent 源码并构建 gateway

Hermes Agent 的 GitHub 仓库地址是https://github.com/hermes-org/hermes。我们不推荐用cargo install hermes-agent，因为 crates.io 上的版本往往滞后于主干，且缺少最新的 gateway 配置项。正确的做法是克隆源码，检出稳定 tag：

# 创建工作目录 mkdir -p ~/projects/hermes && cd ~/projects/hermes # 克隆仓库（使用 GitHub CLI 可加速，若未安装则用 git clone） git clone https://github.com/hermes-org/hermes.git . # 检出最新稳定 release（截至 2024 年 6 月是 v0.8.3） git checkout v0.8.3 # 查看当前分支状态 git status

此时你会看到工作区是干净的。接下来进入gateway子目录，这是我们要构建的核心组件：

cd gateway # 查看 Cargo.toml 确认 rust 版本要求 grep "rust" Cargo.toml # 应输出 rust = "1.75.0" # 开始构建（--release 模式，生成优化后的二进制） cargo build --release

cargo build --release是整个流程中最耗时的环节，首次构建大约需要 6~8 分钟（取决于 CPU 核心数）。它会下载所有依赖 crate（约 120+ 个），编译 Rust 代码，并链接系统库。构建成功后，二进制文件位于target/release/hermes-gateway。你可以用ls -lh target/release/hermes-gateway查看大小，正常应为 12~15MB。此时别急着运行，先做一件关键的事：创建配置文件。Hermes Agent 的 gateway 默认不读取任何配置，所有参数都需通过命令行传入，但为了可维护性，我们创建一个config.yaml：

cat > config.yaml << 'EOF' server: host: "0.0.0.0" port: 8080 cors: true storage: type: "sqlite" path: "./hermes.db" logging: level: "info" EOF

这个配置指定了服务监听所有网络接口（0.0.0.0）、端口8080、启用 CORS（允许微信 Webview 跨域请求）、使用 SQLite 作为本地存储。path: "./hermes.db"表示数据库文件将生成在当前目录下。> 提示：host: "0.0.0.0"是关键。如果写成"127.0.0.1"，微信扫码时会因无法从手机访问127.0.0.1（这是手机自己的回环地址）而失败。必须是0.0.0.0，让服务绑定到 WSL2 的虚拟网卡 IP。

4.2 启动 gateway 并生成连接二维码

配置文件就绪后，就可以启动服务了。在gateway目录下执行：

# 启动 gateway，指定配置文件路径 ./target/release/hermes-gateway --config ./config.yaml

你会看到类似这样的日志输出：

INFO hermes_gateway::server > Starting Hermes Gateway server on 0.0.0.0:8080 INFO hermes_gateway::server > QR code generated: http://localhost:8080/qrcode INFO hermes_gateway::server > WebSocket server started on ws://0.0.0.0:8080/ws

注意第三行：QR code generated: http://localhost:8080/qrcode。这就是微信扫码的入口。现在，打开 Win11 的浏览器（Edge 或 Chrome），访问http://localhost:8080/qrcode，你会看到一个动态刷新的二维码。用手机微信扫描这个二维码。扫描成功后，微信会自动跳转到一个空白页面，并在控制台日志中打印：

INFO hermes_gateway::connection > New connection from device: iPhone14,3 (iOS 17.5)

这表示连接已建立。此时，你可以在微信里发送任意文字，比如“你好”，hermes-gateway的终端会立刻打印：

INFO hermes_gateway::message > Received message from iPhone14,3: "你好"

但此时它还不会回复，因为还没有接入任何 LLM 模型。不过，连接本身已经 100% 成功。这一步验证了从 WSL2 网络、Rust 运行时、HTTP 服务、到微信 Webview 调用的全链路畅通。我建议在此刻截图保存日志，作为你部署成功的凭证。很多新手在这里卡住，原因往往是：1）Win11 防火墙未放行端口；2）config.yaml里host写成了127.0.0.1；3）手机和电脑不在同一 WiFi 下。逐一排查即可。

4.3 接入本地 LLM：用 Ollama 运行 Qwen2-0.5B，实现真正对话

Hermes Agent 本身不包含大模型，它只是一个“管道”和“调度器”。要让它开口说话，你需要接入一个本地运行的 LLM。Ollama 是目前最简单的选择，它提供了预编译的 Windows 客户端，且模型库丰富。在 Win11 上下载 Ollama 安装包（官网ollama.com），安装后以管理员身份运行 PowerShell，执行：

# 拉取 Qwen2-0.5B 模型（体积小，推理快，适合本地测试） ollama run qwen2:0.5b

Ollama 会自动下载约 1.2GB 的模型文件，并启动一个本地 API 服务，默认监听http://127.0.0.1:11434。现在回到 WSL2 的 Ubuntu 终端，在gateway目录下，我们需要修改config.yaml，告诉 Hermes Agent 去哪里找模型：

# 编辑配置文件，添加 llm 配置块 cat >> config.yaml << 'EOF' llm: provider: "ollama" base_url: "http://host.docker.internal:11434" model: "qwen2:0.5b" temperature: 0.7 max_tokens: 512 EOF

这里的关键是base_url: "http://host.docker.internal:11434"。host.docker.internal是 Docker Desktop 提供的特殊 DNS 名称，指向宿主机。但我们现在没用 Docker Desktop！然而，WSL2 也支持这个别名。微软在 WSL2 的/etc/hosts文件中默认添加了127.0.0.1 host.docker.internal这一行，所以http://host.docker.internal:11434实际上就是http://127.0.0.1:11434，即 Win11 上 Ollama 的服务地址。这是一个巧妙的“借名”技巧，避免了手动查 WSL2 的宿主机 IP。保存配置后，重启hermes-gateway：

# 先 Ctrl+C 停止当前进程 # 再重新启动 ./target/release/hermes-gateway --config ./config.yaml

再次用微信扫码，发送“你好”，这次你会看到 gateway 日志里不仅有Received message，还会出现Sending request to Ollama...和LLM response: "你好！很高兴见到你。"。实测 Qwen2-0.5B 在我的 Ryzen 7 7840HS 笔记本上，单次响应平均延迟为 2.3 秒，完全可用。> 实操心得：不要一上来就跑 7B 或 14B 模型。Qwen2-0.5B 是经过充分验证的“黄金起点”，它能在 16GB 内存的机器上流畅运行，且中文理解准确率远超同体积竞品。等你跑通全流程后，再逐步升级模型。

5. 常见问题与排查技巧实录：那些没人告诉你但每天都在发生的坑

5.1 问题速查表：高频故障与一招解决法

问题现象	根本原因	一招解决法	验证方式
`wsl --update`报错`Access is denied`	PowerShell 未以管理员身份运行	关闭当前窗口，右键 PowerShell 图标，选择“以管理员身份运行”	执行`whoami`，输出应为`your-pc-name\your-username`，而非`NT AUTHORITY\SYSTEM`
`cargo build`卡在`Downloading crates.io-index`	rustup 使用了国外源	手动配置 crates.io 镜像：`echo 'registry = "https://rsproxy.cn"' > ~/.cargo/config.toml`	删除`target`目录后重试`cargo build`，下载速度应明显提升
微信扫码后显示“网络错误”	Win11 防火墙阻止了 WSL2 的 localhost 端口	在 Win11 设置 → 隐私和安全性 → Windows 安全中心 → 防火墙和网络保护 → 允许应用通过防火墙 → 勾选`Windows Subsystem for Linux`	用 Win11 浏览器访问`http://localhost:8080/qrcode`，能显示二维码即成功
`hermes-gateway`启动后日志无`QR code generated`行	`config.yaml`文件路径错误或格式非法	用`yamllint config.yaml`检查语法（先`pip3 install yamllint`），确保缩进是空格，不是 Tab	将`config.yaml`内容复制到在线 YAML 验证器（如`https://yamlchecker.com/`）校验
Ollama 模型响应极慢或超时	Win11 的 Ollama 服务被杀毒软件拦截	临时关闭 Windows Defender 实时保护，或在 Defender 设置中将`ollama.exe`加入排除列表	在 Win11 PowerShell 中执行`curl http://127.0.0.1:11434/api/tags`，应返回 JSON 列表

5.2 三个独家避坑技巧，来自我踩过的七次重装

技巧一：WSL2 的磁盘空间不是无限的，定期清理能避免cargo build突然失败
WSL2 的虚拟硬盘文件（ext4.vhdx）默认会随着你安装的包和构建的产物不断膨胀，但不会自动收缩。当它占满 C 盘时，cargo build会报错No space left on device，而df -h显示的却是90%未满。这是因为 WSL2 的 VHDX 文件不会主动释放已删除文件的空间。解决方法：在 Win11 PowerShell（管理员）中执行：

# 关闭所有 WSL 实例 wsl --shutdown # 进入 WSL2 实例，执行磁盘清理 wsl -d Ubuntu-22.04 sudo apt autoremove -y && sudo apt clean && sudo journalctl --vacuum-size=50M exit # 在 PowerShell 中压缩 VHDX diskpart DISKPART> select vdisk file="C:\Users\YourName\AppData\Local\Packages\CanonicalGroupLimited.UbuntuonWindows_79rhkp1fndgsc\LocalState\ext4.vhdx" DISKPART> attach vdisk readonly DISKPART> compact vdisk DISKPART> detach vdisk

这套操作能将ext4.vhdx体积减少 30%~50%，亲测有效。

技巧二：微信扫码后连接断开，十有八九是 WSL2 的 DNS 配置漂移
WSL2 的/etc/resolv.conf文件默认由微软自动生成，指向172.28.0.1这个虚拟网关。但某些路由器或 VPN 软件会篡改这个 IP，导致hermes-gateway无法解析host.docker.internal。解决方法：在 Ubuntu 中执行：

# 锁定 resolv.conf，防止被覆盖 sudo chattr +i /etc/resolv.conf # 手动写入可靠的 DNS echo "nameserver 8.8.8.8" | sudo tee /etc/resolv.conf echo "nameserver 114.114.114.114" | sudo tee -a /etc/resolv.conf

这样，无论网络环境如何变化，DNS 解析都稳定。

技巧三：hermes-gateway启动后 CPU 占用异常高，检查是否启用了--dev模式
Hermes Agent 的--dev参数会启用实时文件监听和热重载，这在开发时很有用，但在生产部署时会持续扫描整个项目目录，造成 CPU 毛刺。我第一次部署时忘了去掉--dev，结果top里hermes-gateway的 CPU 占用长期在 45%。解决方法：永远只用--config参数启动，绝不加--dev。如果需要调试，用cargo run -- --config ./config.yaml，它只在编译时运行，不生成独立二进制。

6. 后续可扩展方向：从“能用”到“好用”的进阶路径

当你已经能用微信和本地 Qwen2-0.5B 对话，恭喜你跨过了最难的门槛。接下来，有三条清晰的进阶路径，可根据你的兴趣和需求选择：

路径一：接入更强的本地模型，提升回答质量
Qwen2-0.5B 是入门之选，但它的知识截止于 2023 年底，且逻辑推理能力有限。你可以无缝升级到qwen2:1.5b或phi3:3.8b。只需在 Win11 上执行ollama run qwen2:1.5b，然后修改config.yaml中的model: "qwen2:1.5b"，重启 gateway 即可。qwen2:1.5b在 32GB 内存的机器上推理速度依然流畅，回答质量有质的飞跃。更进一步，可以尝试llama3:8b，但它需要至少 16GB 显存（通过 Ollama 的 GPU 加速），这时就得在 Win11 上安装 CUDA 驱动并配置 Ollama 的--gpu-layers参数了。

路径二：将 Hermes Agent 封装为 Windows 服务，实现开机自启
目前 gateway 是在 WSL2 终端里手动运行的，关掉终端就停止了。要让它真正“后台化”，可以用systemd。在 Ubuntu 中创建服务文件：

sudo tee /etc/systemd/system/hermes-gateway.service << 'EOF' [Unit] Description=Hermes Gateway Service After=network.target [Service] Type=simple User=your-username WorkingDirectory=/home/your-username/projects/hermes/gateway ExecStart=/home/your-username/projects/hermes/gateway/target/release/hermes-gateway --config /home/your-username/projects/hermes/gateway/config.yaml Restart=always RestartSec=10 [Install] WantedBy=multi-user.target EOF

然后执行sudo systemctl daemon-reload && sudo systemctl enable hermes-gateway && sudo systemctl start hermes-gateway。从此，每次 WSL2 启动，gateway 就自动运行，你再也不用手动干预。

路径三：用微信小程序替代扫码，打造真正的“桌面版”体验
标题里提到的“hermes agent桌面版”，其实是指一个配套的微信小程序。它不依赖扫码，而是通过wx.request直接调用http://localhost:8080/api/v1/message。你可以在微信开发者工具中新建一个小程序项目，将 Hermes Agent 的examples/wechat-miniprogram目录下的代码复制进去，修改app.js中的BASE_URL为http://localhost:8080，然后真机调试。这样，你的微信里就多了一个图标，点击即连，体验接近原生 App。这才是“桌面版”的终极形态——它把 Hermes Agent 从一个命令行工具，变成了一个可被日常使用的生产力入口。

我个人在实际使用中发现，最实用的组合是Qwen2-1.5B + systemd 服务 + 微信小程序。它让我在开会时，随时掏出手机，点开小程序，输入“把刚才讨论的三点总结成 bullet points”，几秒后就得到结构清晰的回复，全程不联网、不上传、不依赖任何第三方服务器。这种掌控感，是 SaaS 类 AI 工具永远无法提供的。最后再分享一个小技巧：在config.yaml的llm块里，加上system_prompt: "你是一个严谨、简洁、不废话的助手。所有回答不超过 50 字。"，这样能极大提升微信对话的效率，避免模型“长篇大论”。

查看全文

http://www.jsqmd.com/news/1055323/