当前位置: 首页 > news >正文

Hermes-Agent :Windows 环境完整安装与 API 中转配置

一、引言

最近在体验一款名为Hermes-Agent​ 的开源 AI 智能体框架,由 Nous Research 出品。它最大的亮点是免训练即可赋予大模型操作电脑的能力(浏览器自动化、代码执行、文件管理、消息网关等),底层支持 300+ 模型,包括 OpenAI、Anthropic、DeepSeek 以及国内主流大模型。

本文记录了我从零开始在Windows 11​ 上安装 Hermes-Agent 的全过程,并重点解决了网络卡顿API Key 配置两大痛点,最终成功接入了DeepSeek 纯文本模型(通过CCSwitch 中转)。希望能帮助同样在 Windows 上折腾的小伙伴少走弯路。

二、Hermes-Agent 介绍

Hermes-Agent 是一个本地运行的 AI 操作员,具备以下核心能力:

  • 多模型支持:兼容 OpenAI、Anthropic、DeepSeek、智谱、Kimi、豆包等 300+ 模型,可随时切换。

  • 工具链集成

    • 浏览器自动化:基于 Playwright,可自动打开网页、点击、填写表单、截图分析。

    • 代码执行沙箱:Python / Shell 直接运行,适合数据处理、脚本调试。

    • 文件操作:读写、解压、解析 PDF/Word/Excel。

    • 联网搜索:实时查询突破模型知识截止。

  • 跨会话记忆:记住项目上下文,无需重复交代背景。

  • 消息网关:可接入 Telegram / Discord / Slack,手机远程指挥。

  • 技能自进化:复杂任务自动沉淀为可复用“技能”。

一句话总结:它是一个能真正“动手”的 AI 助手,而不只是聊天机器人。

三、安装前的环境准备

3.1 硬件与系统要求

  • 操作系统:Windows 10/11(建议 64 位)

  • 处理器:x86/x64 或 ARM64(Surface Pro X 等需选 ARM 版本)

  • 内存:至少 8GB(推荐 16GB)

  • 磁盘空间:至少 5GB(含 Python 虚拟环境、Node 模块、Chromium 浏览器内核)

3.2 前置依赖(可选但推荐)

Hermes-Agent 会自动检测并安装大部分依赖,但提前安装以下工具可避免中途卡顿:

工具

用途

安装命令(管理员 PowerShell)

Git

克隆仓库

winget install Git.Git

Python 3.11

运行核心代码

winget install Python.Python.3.11

Node.js 22 LTS

浏览器工具

winget install OpenJS.NodeJS.LTS

ripgrep

快速文件搜索

winget install BurntSushi.ripgrep.MSVC

ffmpeg

TTS 语音消息

winget install Gyan.FFmpeg

注意:即使不提前安装,安装脚本也会尝试自动下载 PortableGit 和 Hermes 托管的 Node.js,但网络不稳定时容易失败。


四、安装 Hermes-Agent

4.1 一键安装(推荐)

打开PowerShell(建议以管理员身份运行),直接执行以下命令:

irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex

这条命令做了三件事:

  1. Invoke-RestMethod(缩写irm)下载远程脚本。

  2. Invoke-Expression(缩写iex)在当前会话中执行脚本。

  3. 脚本自动完成:安装 uv(Python 包管理器)→ 安装 Python 3.11 → 安装 Git → 安装 Node.js → 克隆仓库 → 创建虚拟环境 → 安装 Python 依赖 → 安装 Node 依赖(含 Playwright Chromium)→ 配置 PATH → 写入配置文件。

安装过程大约需要 5~15 分钟,取决于网络速度和是否首次下载 Chromium(约 170MB)。

4.2 常见问题:网络卡顿与解决方案

终端停留在Installing Node.js dependencies (browser tools)...Installing Playwright Chromium...超过 5 分钟无变化。

原因
  • GitHub raw 域名raw.githubusercontent.com在国内访问不稳定。

  • Playwright 下载 Chromium 时默认从 Google CDN 拉取,经常被墙。

解决方案(二选一)

方案 A:配置代理(如果已有梯子)

在 PowerShell 中设置临时环境变量,指定 HTTP/HTTPS 代理:

$env:HTTP_PROXY="http://127.0.0.1:7890" $env:HTTPS_PROXY="http://127.0.0.1:7890"

然后重新运行安装命令。

方案 B:手动下载 ZIP 并本地安装

如果以上均无效,可手动下载仓库 ZIP:

# 下载 ZIP Invoke-WebRequest -Uri "https://github.com/NousResearch/hermes-agent/archive/refs/heads/main.zip" -OutFile "$env:TEMP\hermes.zip" Expand-Archive -Path "$env:TEMP\hermes.zip" -DestinationPath "$env:TEMP\hermes-extract" Move-Item "$env:TEMP\hermes-extract\hermes-agent-main" "$env:LOCALAPPDATA\hermes\hermes-agent" # 然后进入目录执行本地安装脚本 cd "$env:LOCALAPPDATA\hermes\hermes-agent" .\scripts\install.ps1

4.3 验证安装

安装完成后,关闭当前 PowerShell 窗口并重新打开一个新窗口(使 PATH 生效),然后输入:

hermes --version

如果看到类似hermes 0.x.y的输出,说明安装成功。

五、配置 API Key(核心难点)

5.1 交互式配置

首次运行hermes时会自动进入设置向导,也可手动启动:

hermes setup

向导会引导你选择模型提供商、输入 API Key、配置消息网关等。但对于国内用户,直接使用向导往往会卡在 Stripe 绑卡页面(免费套餐也需要绑定信用卡)。

5.3 使用 Ccswit.ch 中转 DeepSeek API

由于 DeepSeek 官方 API 对国内用户友好,但为了统一管理和方便切换模型,我使用了CCSwitch(一个兼容 OpenAI 格式的 API 中转平台)。步骤如下:

  1. 在 Ccswit.ch 注册账号,进入「渠道管理」添加 DeepSeek 模型。

  2. 获取中转地址(Base URL)和专属 API Key。

六、启动与基本使用

6.1 启动交互式对话

hermes

进入>提示符后,可以像 ChatGPT 一样提问。例如:

> 你好,请用 Python 写一个斐波那契数列生成器。

Hermes 会自动调用代码执行工具,运行并返回结果。

6.2 常用命令速查

命令

作用

hermes

启动交互式对话

hermes setup

重新运行配置向导

hermes config

查看/修改配置

hermes config edit

用编辑器打开配置文件

hermes model

查看/切换当前模型

hermes gateway

启动消息网关(Telegram/Discord)

hermes update

更新到最新版本

hermes --version

查看版本号

6.3 测试 DeepSeek 模型是否正常工作

在 Hermes 对话中输入:

> 1 + 1 等于几?请直接回答。

如果返回2,说明配置成功。


七、进阶技巧与避坑指南

7.1 切换模型

如果需要临时切换到其他模型(如 Claude),无需重新安装,只需修改配置文件中的MODELOPENAI_BASE_URL即可。Hermes 支持热加载,重启会话后生效。

7.2 解决 Windows 下 Git Bash 找不到的问题

Hermes 在执行 Shell 命令时需要bash.exe。安装脚本会自动安装 PortableGit 并设置环境变量HERMES_GIT_BASH_PATH。如果后续出现问题,可手动指定:

$env:HERMES_GIT_BASH_PATH = "C:\Program Files\Git\bin\bash.exe"

7.3 使用 WSL2 获得最佳体验

虽然 Hermes 官方支持 Windows,但许多高级特性(如原生 Linux 工具链、更好的文件权限管理)在WSL2 (Ubuntu)​ 下表现更稳定。安装 WSL2 后,在 Ubuntu 终端中直接运行安装命令,通常无需配置代理即可完成。

# 在 WSL2 Ubuntu 中 curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

7.4 卸载与重装

如果需要完全卸载,删除以下目录:

Remove-Item -Recurse -Force "$env:LOCALAPPDATA\hermes"

然后重新安装即可。

参考资料

  • Hermes-Agent 官方文档:https://hermes-agent.nousresearch.com

  • Ccswit.ch 中转平台:https://ccswitch.xxx

  • DeepSeek 开放平台:https://platform.deepseek.com

http://www.jsqmd.com/news/1113271/

相关文章:

  • CSRF攻击原理与防御实战:从DVWA靶场到企业级防护方案
  • 【Java课程设计/毕业设计】基于 SpringBoot 的 “图书森林” 馆藏图书智能借阅系统的设计与实现 基于 SpringBoot 的共享图书资源可视化管理系统【附源码、数据库、万字文档】
  • 深度强化学习算法实战:从Q-Learning到PPO的工程落地指南
  • CNC加工厂为什么总是延期?从订单跟踪、生产进度到排产管理看问题根源
  • 小程序商城哪个平台好?适合零售、餐饮和服务商家的选型逻辑
  • ClaudeCode模型选型指南:如何为真实编码场景匹配最优AI模型
  • Oracle与Java安全实战:从SQL注入防御到TDE加密的纵深防护体系
  • LINUX编译地图软件GDAL
  • GB_T_27930_报文大全
  • A类系统车桩充电通信流程
  • 携程酒店详情信息一键获取,item_get_appAPI接口讲解
  • Virbox Protector 从何而来:深盾科技的软件保护演进
  • 手把手教你用代码夺回 AI 时代的“被定义权”:广州企业 GEO 实战指南
  • GLM5、千问Coder、Kimi2.5:程序员真实编码场景下的AI模型选型指南
  • 【Java课程设计/毕业设计】基于 SpringBoot 的高校学生组织综合运维管理系统的设计与实现 校园学生组织资料与活动一体化管理系统【附源码、数据库、万字文档】
  • 利用金字塔原理学习MySQL的具象化的庖丁解牛
  • 从“用户投诉才知道”到“出问题前自动告警”:告警系统演进之路
  • 机器学习工程师的实战成长路径:从调包到交付价值
  • Cobalt Strike流量溯源实战:从网络取证到攻击链还原
  • 非对称量化:减少 97% 存储空间,近无损实现后期交互检索!
  • 网站爬虫与数据采集怎么做?(保姆级教程)
  • 抢占AI时代的“数字户口”——丹东来客GEO全域AI引擎系统,重塑企业智能时代的品牌话语权
  • 基于 RPA 架构的企业微信外部群自动化:底层原理、API 设计与多群同步实战
  • 【VibeCoding系列】大型 AI 编程项目工程化治理全栈指南:Claude Code + 国产模型 + Windows 万级文件场景下的上下文、幻觉、一致性终极解决方案
  • 人教版新课标一年级语文上册期中复习试卷A共3页Word版【编号3】
  • 如你所见 ⬇️
  • 2026年天水工厂设备回收:揭秘行业独家秘籍
  • Dify 与 Chatbox、Anything LLM API
  • Nginx生产环境安全加固实战:从协议到配置的全面防护指南
  • 基于Node.js的AI微信答疑小程序开发指南