当前位置: 首页 > news >正文

Hermes Agent 工具-周红伟

工具是扩展智能体能力的函数。它们被组织成逻辑上的工具集,可以在每个平台上启用或禁用。

Hermes Agent 附带了一个广泛的内置工具注册表,涵盖网页搜索、浏览器自动化、终端执行、文件编辑、记忆、委托、RL 训练、消息投递、Home Assistant 等。


可用工具

工具分类

类别示例说明
网页web_search,web_extract搜索网页和提取页面内容
终端和文件terminal,process,read_file,patch执行命令和操作文件
浏览器browser_navigate,browser_snapshot,browser_vision交互式浏览器自动化,支持文本和视觉
媒体vision_analyze,image_generate,text_to_speech多模态分析和生成
智能体编排todo,clarify,execute_code,delegate_task规划、澄清、代码执行和子智能体委托
记忆和召回memory,session_search持久化记忆和会话搜索
自动化和投递cronjob,send_message定时任务(创建/列表/更新/暂停/恢复/运行/删除),以及出站消息投递
集成ha_*, MCP 服务器工具,rl_*Home Assistant、MCP、RL 训练和其他集成

使用工具集

# 使用特定工具集 hermes chat --toolsets "web,terminal" # 查看所有可用工具 hermes tools # 配置每个平台的工具(交互式) hermes tools

常用工具集包括:

  • web— 网页搜索和提取
  • terminal— 终端命令执行
  • file— 文件操作
  • browser— 浏览器自动化
  • vision— 图像分析
  • image_gen— 图像生成
  • skills— 技能系统
  • tts— 文本转语音
  • todo— 任务管理
  • memory— 记忆系统
  • session_search— 会话搜索
  • cronjob— 定时任务
  • code_execution— 代码执行
  • delegation— 任务委托
  • clarify— 澄清问题
  • homeassistant— Home Assistant 集成
  • rl— 强化学习训练

平台预设:工具集还包括平台预设,如hermes-clihermes-telegram以及动态 MCP 工具集如mcp-<server>


终端后端

终端工具可以在不同的环境中执行命令:

后端说明适用场景
local在本地机器运行(默认)开发、可信任务
docker隔离容器安全、可重现性
ssh远程服务器沙盒、保持 agent 远离自己的代码
singularityHPC 容器集群计算、无 root
modal云端执行无服务器、弹性扩展
daytona云沙盒工作区持久远程开发环境

配置

# ~/.hermes/config.yaml terminal: backend: local # 或: docker, ssh, singularity, modal, daytona cwd: "." # 工作目录 timeout: 180 # 命令超时时间(秒)

Docker 后端

terminal: backend: docker docker_image: python:3.11-slim

SSH 后端

推荐用于安全场景——agent 无法修改自己的代码:

terminal: backend: ssh
# 在 ~/.hermes/.env 中设置凭据 TERMINAL_SSH_HOST=my-server.example.com TERMINAL_SSH_USER=myuser TERMINAL_SSH_KEY=~/.ssh/id_rsa

Modal(无服务器云)

uv pip install modal modal setup hermes config set terminal.backend modal

容器资源

terminal: backend: docker container_cpu: 1 # CPU 核心数 container_memory: 5120 # 内存 MB(默认 5GB) container_disk: 51200 # 磁盘 MB(默认 50GB) container_persistent: true # 跨会话持久化

容器安全

所有容器后端都使用安全加固运行:

  • 只读根文件系统(Docker)
  • 删除所有 Linux 能力
  • 无权限提升
  • PID 限制(256 个进程)
  • 完整命名空间隔离
  • 通过卷实现持久工作区,而非可写根层

后台进程管理

启动后台进程并管理它们:

terminal(command="pytest -v tests/", background=true) # 返回: {"session_id": "proc_abc123", "pid": 12345} # 然后使用 process 工具管理: process(action="list") # 显示所有运行中的进程 process(action="poll", session_id="proc_abc123") # 检查状态 process(action="wait", session_id="proc_abc123") # 阻塞直到完成 process(action="log", session_id="proc_abc123") # 完整输出 process(action="kill", session_id="proc_abc123") # 终止 process(action="write", session_id="proc_abc123", data="y") # 发送输入

PTY 模式(pty=true)启用交互式 CLI 工具如 Codex 和 Claude Code。


Sudo 支持

如果命令需要 sudo,系统会提示您输入密码(为会话缓存)。或设置SUDO_PASSWORD~/.hermes/.env中。

警告:在消息平台上,如果 sudo 失败,输出会包含添加到~/.hermes/.env的提示。

提示:使用hermes tools命令可以交互式配置每个平台启用的工具。

http://www.jsqmd.com/news/638355/

相关文章:

  • 星穹铁道自动化工具终极指南:5分钟解放每日游戏时间
  • Holistic Tracking镜像实战案例:如何用一张照片驱动虚拟数字人?
  • Qwen3-14B API服务教程:Postman调用+JSON Schema参数校验示例
  • 研究生必看!7款AI论文神器,知网查重一把过不留AIGC痕迹 - 麟书学长
  • PETRV2-BEV GPU算力优化教程:batch_size=2下显存占用与训练效率分析
  • Qwen3.5-9B惊艳案例:古籍扫描图上传→OCR文字识别→繁体转简体→语义注释
  • 2026年MySQL安装教程(超详细)
  • Windows安卓子系统终极指南:从零到精通完整教程
  • BLDC驱动电路设计要点解析
  • Qwen3.5-9B-AWQ-4bit保姆级教程:Web界面响应延迟优化与前端体验提升技巧
  • 告别识别率焦虑:视频 AI 工程化实战 —— 检测→判定→聚合→治理全链路拆解
  • Z-Image-GGUF入门必看:中英文提示词编写技巧+负向过滤避坑指南
  • RexUniNLU效果惊艳展示:中文短视频脚本生成前的多任务语义分析
  • 高效智能的B站会员购抢票神器:让二次元门票不再难求
  • RVC开源贡献指南:如何为RVC WebUI新增语言/功能模块
  • Windows安卓子系统(WSA)实用指南:3步快速部署与5大优化技巧
  • 如何高效下载B站视频:5个DownKyi实用技巧完全指南
  • Pixel Mind Decoder 环境部署详解:Ubuntu系统下Docker快速安装
  • Linux第二节课
  • 用KeyShot工具渲染PCB图过程
  • Go语言的sync.RWMutex内存屏障
  • 【每天认识一种网柄菌】——似克拉肯简基菌
  • NaViL-9B医疗影像初筛:X光片描述生成+异常区域提示案例
  • UniApp实战:Android原生插件实现动态时间水印踩坑全记录(附完整代码)
  • Qwen3智能字幕对齐系统与Dify平台集成实践
  • Qwen-Image-2512-Pixel-Art-LoRA 安全加固:防范针对图像生成API的网络安全攻击
  • PowerShell文件切割避坑指南:如何正确处理含中文的CSV大文件
  • 用Python和CCXT库从零搭建一个数字货币量化交易机器人(附完整代码)
  • 哔哩下载姬完全指南:5步掌握B站视频下载终极方法
  • LoRA训练助手入门指南:3步完成你的第一个风格迁移模型