当前位置：首页 > news >正文

基于有限状态机（FSM）的LLM智能体架构：Haath项目解析与实践

news 2026/5/11 0:51:23

1. 项目概述：一个基于有限状态机的自主LLM智能体

如果你和我一样，在尝试构建或使用大型语言模型智能体时，常常感到困惑——为什么一个看似简单的任务，智能体却会陷入“工具选择困难症”，或者在复杂的多步流程中迷失方向？传统的智能体架构往往将所有的工具和能力一次性、扁平化地暴露给模型，这就像把一个装满数百种工具的工具箱直接塞给一个新手，然后指望他能立刻找到正确的螺丝刀并知道怎么用。结果往往是大量的上下文令牌被浪费在无关信息上，智能体的决策路径变得不可预测，调试起来更是噩梦。

Haath这个项目，正是为了解决这个核心痛点而生的。它不是一个全新的“模型”，而是一套架构范式和运行时系统。它的核心思想非常直观且有力：让智能体在一个有限状态机里“生活”和“工作”。简单来说，Haath为智能体规划了一条“工作流水线”，智能体在任何时刻，都只知道自己当前处在流水线的哪个工位，这个工位上有哪些特定的工具和操作说明，以及接下来可以合法地移动到哪几个相邻的工位。它看不到整个工厂的全貌，这反而让它更专注、更高效。

这套架构由几个关键组件紧密协作而成：ASMP定义了状态机的协议和运行时；clrun提供了与外部世界（尤其是命令行）交互的统一界面；而Haath本身则作为“总控台”，负责协调学习、状态机演化以及通过Waterfall网关进行资源管理和成本核算。最终呈现给开发者和使用者的，是一个行为更可控、成本更透明、且能够通过工作流积累经验不断自我进化的智能体系统。

无论你是想构建一个能自动化处理复杂运维任务的AI助手，还是一个能按严格流程执行客户支持的分析型智能体，Haath提供的这套“状态机约束下的渐进式能力披露”框架，都值得你深入了解。它尤其适合那些对智能体的可靠性、可预测性和运营成本有较高要求的场景。

2. 核心架构与设计哲学拆解

2.1 有限状态机：为何是智能体控制的“最佳实践”？

在软件工程中，有限状态机是描述对象在其生命周期内所经历的状态序列，以及如何响应来自外部的各种事件。将它应用于LLM智能体，是一种降维打击式的设计。

传统的智能体架构可以类比为一个拥有完全记忆和无限联想能力，但缺乏纪律的“天才”。你给它一个目标（比如“部署一个Web服务”），然后它就开始在庞大的工具库（Git、Docker、kubectl、云平台CLI、监控工具……）中搜索和尝试。这个过程充满了不确定性：它可能突然决定先去优化一个无关的配置文件，或者陷入对某个工具参数的无限追问中。问题的根源在于，决策空间太大且缺乏结构性约束。

Haath的FSM架构则将这个“天才”放到了一个设计好的“工作坊”里。这个工作坊被划分成多个清晰的“工作站”（状态），例如：“需求分析站”、“代码检出站”、“依赖安装站”、“构建打包站”、“部署配置站”、“验证测试站”。每个工作站：

有明确的提示：告诉智能体“你现在在这个站，你的核心任务是什么”。
有有限的出口：明确列出“完成这个站的任务后，你只能去A站或B站”。
有专用的工具：只提供这个站需要的工具（例如在“构建打包站”只提供Docker和Make相关命令）。
可关联技能：可以为该状态绑定一个更复杂的“技能模块”，仅在进入该状态时加载。

这样做带来了几个根本性优势：

令牌效率：每次模型推理，上下文窗口里只有当前状态的元数据（提示、可用工具、下一状态），而不是所有工具的完整描述。这能显著降低每次交互的成本，并允许使用更长的提示来精确定义单个状态的行为。
行为可控性：智能体的行动路径被状态转移图所定义和限制。它无法做出不符合流程的“跳跃”，这极大地提高了复杂流程的完成率和可重复性。
可调试性：当智能体出错时，你可以精确地定位到是哪个状态下的决策出了问题，是提示不清、工具不足还是状态转移定义有误。调试从“魔盒”变成了“可追溯的流程”。
模块化与复用：一个设计好的、能成功完成“代码审查”流程的状态机，可以作为一个模块，被轻松地导入到另一个需要代码审查环节的更大流程中。

2.2 渐进式披露 vs. 扁平化工具菜单：一次关键的范式转换

让我们通过一个具体的对比来感受这两种设计的差异。假设我们要让智能体完成“在服务器上排查一个服务故障”。

扁平化菜单模式：你会给智能体的提示可能是：“你可以使用以下工具：ssh_exec（在远程服务器执行命令）、read_log（读取日志文件）、check_port（检查端口状态）、restart_service（重启服务）、analyze_metric（查询监控指标）、search_knowledge_base（搜索知识库）……（此处列出20个工具）”。然后下达指令：“服务X不响应，请排查。”

智能体需要自己决定从哪里开始。它可能先search_knowledge_base，也可能直接restart_service。这个过程充满了随机性，并且每次思考都要在上下文中携带这20个工具的冗长描述。

Haath的渐进式披露模式：你会预先定义一个“故障排查”状态机，包含如下状态：

状态：初步诊断
- 提示：“你已连接到目标服务器。请首先确认服务进程是否存活，并检查关键端口。”
- 可用工具：ssh_exec(仅限ps,netstat,systemctl status命令)
- 下一状态：日志审查，深度指标检查
状态：日志审查（从初步诊断进入）
- 提示：“进程存在但无响应。现在需要检查最近的应用日志和系统日志，寻找错误信息。”
- 可用工具：ssh_exec(仅限tail,grep,journalctl命令)，read_log(结构化日志读取)
- 下一状态：问题修复，深度指标检查
状态：深度指标检查（从初步诊断或日志审查进入）
- 提示：“需要查看系统资源（CPU、内存、磁盘、网络）使用情况，判断是否为资源瓶颈。”
- 可用工具：ssh_exec(仅限top,df,iftop命令)，analyze_metric(查询监控平台)
- 下一状态：问题修复，知识库检索
状态：问题修复（从日志审查或深度指标检查进入）
- 提示：“已定位问题原因（例如：磁盘已满、配置错误）。请执行修复操作。”
- 可用工具：ssh_exec(范围扩大，可包含清理、修改配置等命令)，restart_service
- 下一状态：验证测试
状态：验证测试
- 提示：“修复操作已完成。请验证服务是否恢复正常。”
- 可用工具：check_port,ssh_exec(执行健康检查命令)
- 下一状态：结束（成功），回滚（失败）

在这个模式下，智能体从初步诊断状态开始。它的“视野”里只有这个状态的提示和两个可用工具（受限的ssh_exec）。它执行检查，根据结果，状态机只允许它转移到日志审查或深度指标检查。它选择进入日志审查，此时它的“视野”更新为该状态的提示和工具集，完全忘记了深度指标检查状态下的analyze_metric工具，除非它之后转移过去。

实操心得：设计状态机的关键，在于对领域工作流的深刻理解。你需要像设计用户界面一样设计状态流——每个界面（状态）只提供完成当前步骤的必要信息和控制项。好的状态机设计，能让智能体像经验丰富的工程师一样，遵循最佳实践路径来解决问题。

2.3 核心组件协同工作流解析

Haath系统的运行，是多个组件各司其职、紧密配合的结果。我们可以将其执行循环分解为以下几个步骤：

感知状态帧：智能体网关向ASMP服务器请求当前运行实例的状态帧。这个帧包含了当前状态的所有信息：提示文本、合法的下一状态列表、本状态可用的工具/资源列表，以及可能绑定的活动技能。
模型决策：网关将精简后的状态帧（可能加上对话历史等额外上下文）通过Waterfall网关发送给LLM。Waterfall在这里扮演了“流量控制器”和“计费器”的角色，确保调用被计量、限速且成本可见。LLM基于当前状态帧，决定是触发一个工具调用，还是执行一个状态转移。
执行动作：网关将LLM的决定（例如“调用工具A，参数为X”）发送回ASMP服务器。ASMP服务器验证该动作在当前状态下是否合法，如果合法，则执行对应的处理函数。
外部交互：如果被执行的动作涉及命令行操作（这是很常见的），ASMP服务器会通过与它连接的clrun会话来执行具体的命令。clrun负责处理复杂的终端交互，包括处理需要用户输入的安装程序、在TUI界面中导航，并将执行结果以结构化的YAML格式（包含输出、提示、警告）返回。
状态更新与循环：动作执行完毕后，ASMP服务器更新状态（可能转移到新状态，也可能停留在原状态），并生成新的状态帧。整个循环回到第1步，直到工作流到达某个终止状态。

这个循环的精妙之处在于责任分离：ASMP负责“工作流逻辑”和“状态管理”，LLM负责在约束下的“微观决策”，clrun负责“与操作系统交互”，而Waterfall负责“资源管控”。这种分离使得每个部分都可以独立优化和扩展。

3. 核心组件深度剖析与实操要点

3.1 ASMP：定义智能体工作流的“宪法”

ASMP是整套体系的基石。它不仅仅是一个实现，更是一套协议规范，定义了状态机如何与智能体交互。理解ASMP的几个核心概念至关重要：

状态：工作流中的一个步骤。它有一个唯一ID、一个可读名称、一段自然语言提示、一个可选的“活动技能”引用，以及一些元数据。
转移：从一个状态到另一个状态的边。它定义了在什么条件下（例如，某个工具调用成功或失败后）可以发生转移。
工具：在特定状态下暴露给智能体的能力。在ASMP中，工具通常映射为HTTP端点。当智能体调用一个工具时，ASMP服务器会执行对应的处理函数。
资源：与状态关联的静态或动态数据，例如API密钥、配置文件片段、参考文档等。它们作为上下文的一部分提供给智能体。
状态帧：这是ASMP输出给智能体的核心数据结构。它是一个JSON对象，包含了智能体在当前时刻做出决策所需的一切信息，且仅此而已。

一个简化的状态帧示例：

{ “state_id”: “gather_requirements”, “hint”: “你正在与用户沟通以收集项目需求。请提出开放性问题，澄清模糊点。”, “next_states”: [“design_architecture”, “clarify_details”], “tools”: [ { “name”: “ask_user”, “description”: “向用户提出一个问题以获取更多信息。”, “parameters”: {“question”: “string”} }, { “name”: “summarize”, “description”: “将目前已收集的需求总结并反馈给用户确认。”, “parameters”: {} } ], “active_skill”: null }

实操要点：

提示工程下沉到状态设计：你的主要工作从编写庞大的、试图覆盖所有情况的系统提示，转变为为每个状态编写精准、具体的提示。这更容易，也更容易见效。
工具设计应粒度适中：避免设计“巨无霸”工具。一个好的工具应该完成一个单一、明确的任务。例如，与其有一个“管理服务器”的工具，不如拆分成“检查服务状态”、“重启服务”、“查看日志”等多个工具，并在不同的状态下暴露不同的子集。
利用active_skill进行能力复用：对于复杂的、可复用的子流程（例如“执行一次安全的数据库查询”），可以将其封装成一个独立的“技能”模块。这个技能可以在多个需要它的状态中被引用和加载，实现代码和逻辑的复用。

3.2 clrun：智能体与真实世界交互的“手和脚”

clrun解决了智能体操作中的一个老大难问题：如何可靠地执行命令行任务，尤其是那些交互式的、有TUI界面的任务。它不是一个简单的subprocess.Popen封装，而是一个完整的交互式终端会话管理器。

它的核心功能包括：

持久化会话：启动一个长时间运行的任务（例如tail -f logfile或一个Python交互式解释器），并保持连接，后续可以继续向该会话发送输入或读取输出。
结构化输出：所有命令执行结果都以YAML格式返回，包含output（标准输出）、error（标准错误）、exit_code，以及可选的hints（来自ASMP的后续建议）和warnings。
TUI自动化：可以模拟按键（如方向键、Enter、Tab）来与像vim、htop或ncdu这样的文本用户界面程序交互。
ASMP远程CLI模式：这是clrun与Haath集成的关键。在此模式下，clrun不再直接执行本地命令，而是连接到ASMP服务器的/cli端点。ASMP服务器会根据当前状态，动态地告诉clrun哪些命令是可用的。这使得智能体驱动的CLI体验与状态机深度绑定。

使用示例：假设在某个“代码构建”状态，ASMP通过clrun暴露了make build命令。

智能体决定调用该命令。
ASMP服务器收到请求，通过clrun会话执行make build。

clrun执行命令，捕获输出，并返回如下结构：

output: | gcc -o app main.c utils.c Build successful. exit_code: 0 hints: - “构建成功。下一步可以运行测试（make test）或启动服务（./app）。”

ASMP服务器将这个结果返回给智能体，智能体根据输出和hints决定下一步行动（例如，转移到“运行测试”状态）。

注意事项：使用clrun执行高风险命令（如rm -rf /）时，必须在ASMP的状态处理函数中进行严格的参数验证和权限控制。永远不要将未经过滤的用户输入或模型直接生成的内容传递给clrun。最佳实践是在ASMP层定义安全的、参数化的工具，例如clean_directory工具，其处理函数内部会检查路径是否在允许的白名单内，再调用clrun执行rm -rf ${safe_path}。

3.3 Haath网关与Waterfall：可控的成本与运营中心

Haath网关项目提供了一个开箱即用的控制平面。它有两个主要作用：

配置管理：通过Web UI或REST API，管理智能体的配置（如使用哪个LLM模型、API密钥、活跃的工作流）、查看运行状态。
集成Waterfall：这是其在生产环境中的关键价值。Waterfall是一个LLM网关和成本管理平台。将所有LLM API调用（无论是通往OpenAI、Anthropic还是本地模型）都路由通过Waterfall，可以带来：
- 成本分摊与预算控制：可以为不同团队、不同项目设置预算和速率限制。
- 统一的监控与审计：所有AI调用都有日志，便于调试和合规审查。
- 供应商抽象：可以在Waterfall层面配置故障转移和负载均衡，例如当OpenAI API超时时自动切换到备用供应商。

部署思考：对于个人或小团队实验，你可以直接运行Haath网关，并配置使用直接的API密钥。但对于任何严肃的、多团队协作的或涉及预算的项目，强烈建议集成Waterfall或类似的网关方案。它将不可见的AI消费变成了像云服务器账单一样可管理、可预测的运营成本。

4. 从零开始构建一个Haath智能体：实操指南

4.1 环境准备与项目初始化

假设我们要构建一个自动化的“服务器健康检查”智能体。它会登录服务器，检查系统负载、磁盘空间、关键服务状态，并生成报告。

首先，确保你的开发环境已就绪：

# 1. 安装基础依赖 (以Ubuntu为例) sudo apt-get update sudo apt-get install -y python3-pip nodejs npm git # 2. 克隆相关仓库 git clone https://github.com/cybertheory/haath.git git clone https://github.com/cybertheory/asmp.git git clone https://github.com/cybertheory/clrun.git # 3. 安装ASMP的Python SDK (我们用它来构建FSM服务器) cd asmp/sdks/python pip install -e . cd ../../.. # 4. 安装clrun cd clrun pip install -e . cd .. # 5. 安装并启动Haath网关 (控制面板) cd haath/gateway npm install # 测试环境变量，避免污染你的全局配置 export HAATH_DATA_DIR=$(mktemp -d) npm run dev & # 网关将在 http://localhost:28657 启动 cd ../..

4.2 定义ASMP状态机：编写“健康检查”工作流

我们在项目根目录创建一个health_check_fsm.py文件来定义状态机。

# health_check_fsm.py import asyncio from typing import Any, Dict from asmp.server import ASMPServer, State, Transition from clrun import ClrunSession class HealthCheckFSM: def __init__(self): self.server = ASMPServer(title=“服务器健康检查智能体”) self.clrun_session = ClrunSession() # 创建一个clrun会话用于执行命令 self._define_states() self._define_transitions() def _define_states(self): # 状态1: 连接服务器 self.server.add_state(State( id=“connect”, name=“连接目标服务器”, hint=“请提供需要检查的服务器SSH连接信息（主机、用户名、密钥路径）。我们将建立连接。”, tools=[“provide_ssh_info”] )) # 状态2: 检查系统负载 self.server.add_state(State( id=“check_load”, name=“检查系统负载”, hint=“已连接服务器。正在检查当前CPU和内存负载。高负载可能表明需要扩容。”, tools=[“get_load_average”, “get_memory_usage”] )) # 状态3: 检查磁盘空间 self.server.add_state(State( id=“check_disk”, name=“检查磁盘使用率”, hint=“正在检查根目录和关键数据目录的磁盘使用情况。使用率超过80%需要告警。”, tools=[“get_disk_usage”] )) # 状态4: 检查服务状态 self.server.add_state(State( id=“check_services”, name=“检查关键服务”, hint=“正在检查预设的关键服务（如nginx, postgres, redis）是否正在运行。”, tools=[“check_service_status”] )) # 状态5: 生成报告 self.server.add_state(State( id=“generate_report”, name=“生成健康检查报告”, hint=“所有检查已完成。请汇总发现的问题和建议，生成一份简要报告。”, tools=[“compile_report”] )) # 状态6: 完成/失败 self.server.add_state(State( id=“done”, name=“检查完成”, hint=“健康检查流程已结束。报告已生成。”, is_terminal=True )) self.server.add_state(State( id=“failed”, name=“连接失败”, hint=“无法连接到目标服务器，请检查网络和凭据。”, is_terminal=True )) def _define_transitions(self): # 从“连接”状态，成功提供信息后转到“检查负载” self.server.add_transition(Transition( from_state=“connect”, to_state=“check_load”, trigger=“provide_ssh_info_success” )) # 从“连接”状态，如果提供信息失败，转到“失败” self.server.add_transition(Transition( from_state=“connect”, to_state=“failed”, trigger=“provide_ssh_info_failure” )) # 定义后续的线性流程 self.server.add_transition(Transition( from_state=“check_load”, to_state=“check_disk”, trigger=“load_check_complete” )) self.server.add_transition(Transition( from_state=“check_disk”, to_state=“check_services”, trigger=“disk_check_complete” )) self.server.add_transition(Transition( from_state=“check_services”, to_state=“generate_report”, trigger=“services_check_complete” )) self.server.add_transition(Transition( from_state=“generate_report”, to_state=“done”, trigger=“report_generated” )) # --- 工具处理函数 --- # 每个工具对应一个async函数，由ASMP在相应状态下调用 async def tool_provide_ssh_info(self, params: Dict[str, Any]) -> Dict[str, Any]: host = params.get(“host”) user = params.get(“user”) # 在实际应用中，这里会使用paramiko或asyncssh建立连接 # 此处为示例，我们模拟连接 print(f“[模拟] 尝试连接 {user}@{host}...”) # 模拟连接成功 self.ssh_connected = True return { “output”: f“已成功连接到 {host}。”, “next_trigger”: “provide_ssh_info_success” # 触发状态转移 } async def tool_get_load_average(self, params: Dict[str, Any]) -> Dict[str, Any]: # 通过clrun执行远程命令 (模拟) # 真实场景: result = await self.clrun_session.execute(“ssh user@host ‘uptime’”) result = {“output”: “load average: 0.12, 0.08, 0.05”, “exit_code”: 0} return { “output”: f“系统负载: {result[‘output’]}”， “hints”: [“负载非常低，系统空闲。”] } async def tool_get_disk_usage(self, params: Dict[str, Any]) -> Dict[str, Any]: # 模拟执行 df -h result = {“output”: “/dev/root 79G 50G 26G 67% /”， “exit_code”: 0} usage = 67 hint = “磁盘使用率67%，处于健康范围。” if usage < 80 else “警告：磁盘使用率超过80%，建议清理！” return { “output”: f“磁盘使用情况: {result[‘output’]}”， “hints”: [hint], “next_trigger”: “disk_check_complete” } # ... 其他工具函数 check_service_status, compile_report 等 def run(self): # 将工具函数注册到对应的状态 self.server.register_tool(“connect”, “provide_ssh_info”, self.tool_provide_ssh_info) self.server.register_tool(“check_load”, “get_load_average”, self.tool_get_load_average) self.server.register_tool(“check_disk”, “get_disk_usage”, self.tool_get_disk_usage) # ... 注册其他工具 # 启动ASMP服务器 import uvicorn uvicorn.run(self.server.app, host=“0.0.0.0”, port=8080) if __name__ == “__main__”: fsm = HealthCheckFSM() fsm.run()

这个脚本定义了一个简单的线性状态机。每个状态都有明确的职责和有限的工具。工具处理函数模拟或实际执行检查任务，并返回结构化的结果和可选的“下一步提示”或“转移触发器”。

4.3 配置Haath网关并连接智能体

启动FSM服务器：在终端运行python health_check_fsm.py。你的ASMP服务器将在http://localhost:8080运行。
配置网关：打开浏览器访问http://localhost:28657。在网关的配置页面，你需要设置：
- Agent Config: 指定LLM供应商（如OpenAI）、模型（如gpt-4）和API密钥（或通过Waterfall配置）。
- ASMP Endpoint: 设置为http://localhost:8080。这是网关与你的状态机对话的地址。
- Workflow: 选择或上传你的工作流定义（ASMP服务器启动后通常会暴露一个描述自身状态图的端点）。
启动智能体运行：通过网关的API或UI创建一个新的“运行”。网关会向ASMP服务器发起一个新的工作流实例，并从初始状态（connect）开始。
观察与交互：智能体现在处于connect状态。网关会获取该状态帧（包含提示和provide_ssh_info工具）并发送给LLM。LLM会理解它需要询问SSH信息。网关将LLM生成的参数（主机、用户）传递给ASMP服务器的工具处理函数。函数执行后返回成功，并触发provide_ssh_info_success，状态机自动转移到check_load状态。如此循环，直到到达done或failed终止状态。

4.4 进阶：工作流的演化与共享

Haath的另一个强大特性是工作流可演化。假设在运行多次后，你发现“检查磁盘”后总是需要额外检查一下“/var/log”目录的大小，因为那里经常爆满。

你不需要重新训练模型或修改大量代码。你可以直接动态修改运行中的FSM（通过ASMP的管理API），在check_disk和check_services状态之间插入一个新的状态check_var_log。这个新状态有自己的提示和工具（例如check_directory_size）。修改后，新的运行实例就会自动遵循这个优化后的流程。

更酷的是，你可以将这个优化后的状态机导出为一个JSON或YAML文件。这个文件可以被团队的其他成员导入到他们的Haath实例中，或者合并到另一个更复杂的运维工作流里。这就实现了“最佳实践”工作流的沉淀和团队级复用。

5. 常见问题、排查技巧与性能优化

5.1 智能体在某个状态“卡住”或做出错误选择

这是最常见的问题。排查思路如下：

检查状态帧：首先，通过ASMP服务器的API直接获取当前的状态帧（GET /runs/{run_id}/frame）。查看返回给模型的hint是否清晰无歧义？tools的描述是否准确？next_states的列表是否正确？
审查模型输入：在Haath网关或Waterfall的日志中，查看发送给LLM的完整提示。确认状态帧的信息被正确格式化并包含在内。有时候，无关的对话历史或系统提示可能会干扰模型对当前状态的理解。
简化与测试：尝试将该状态独立出来测试。创建一个只有这个状态的迷你FSM，用相同的输入测试模型的输出。如果仍然出错，问题可能出在工具描述或状态提示上。尝试用更简单、更直白的语言重写提示。
利用约束：如果模型总是试图调用一个不该在当前状态出现的工具，检查ASMP的配置。确保该工具没有被错误地注册到当前状态。ASMP的约束机制是防止模型“越界”的第一道防线。

实操心得：为每个状态设计提示时，采用“角色-任务-约束”的模板非常有效。例如：“【角色】你现在是系统管理员。【任务】你需要检查Nginx服务的运行状态。【约束】你只能使用下面提供的‘check_nginx’工具，并且完成后必须触发‘service_checked’事件。”这种结构能极大提高模型响应的准确性。

5.2 clrun命令执行失败或超时

权限问题：确保运行Haath/ASMP服务的用户有权限执行clrun所调用的命令。特别是在Docker容器中运行时，需要注意用户映射和卷挂载的权限。
环境变量：clrun执行的命令可能依赖于特定的环境变量（如PATH,JAVA_HOME）。确保启动clrun会话时环境是正确的。可以在ASMP的工具处理函数中，在调用clrun前预先设置好环境。
交互式超时：对于需要长时间运行或有用户交互提示的命令，clrun默认可能有超时设置。你需要根据命令特点调整clrun的timeout参数，或者使用其交互模式来响应提示。
输出解析：clrun返回的YAML中，如果命令输出非常庞大，可能会影响后续处理。考虑在工具层对输出进行预处理、截断或提取关键信息后再返回给模型。

5.3 性能优化与成本控制

状态设计的令牌经济：尽可能保持每个状态的hint简洁。将详细的背景信息或知识库内容放在状态的resources字段中，并指示模型“如果需要，可以参考以下资源”。这样，只有在模型明确需要时，这些长文本才会被纳入上下文。
缓存常用结果：如果某个工具调用（如查询数据库状态）结果在短时间内不会变化，可以在ASMP服务器层实现一个简单的缓存，避免重复调用和消耗LLM令牌去处理相同的信息。
利用Waterfall特性：
- 设置预算和限额：为每个项目或环境设置严格的月度预算和每分钟速率限制，防止意外超支。
- 使用更便宜的模型进行简单决策：在Waterfall中配置路由规则。例如，对于只是选择下一个状态的简单决策，可以路由到gpt-3.5-turbo；对于需要复杂分析或生成报告的状态，再路由到gpt-4。Haath网关与Waterfall的集成让这种分级调用变得容易管理。
- 分析日志：定期查看Waterfall的日志，识别哪些状态或工具调用最频繁、消耗令牌最多。针对这些热点进行优化，比如优化提示、拆分状态或改进工具效率。

5.4 安全考量

工具调用的沙盒化：所有通过clrun执行的命令，都必须经过ASMP工具处理函数的严格校验。绝不将未经处理的、由模型生成的字符串直接拼接成命令执行。应采用参数化调用，并在服务端进行白名单校验。
访问控制：Haath网关和ASMP服务器的API端点应该部署在内部网络，或通过认证（如API Key、JWT）进行保护。避免将智能体的控制面板暴露在公网。
敏感信息处理：SSH密钥、API令牌等敏感信息不应硬编码在状态机定义或代码中。应使用环境变量或秘密管理服务（如HashiCorp Vault），并在运行时由ASMP服务器动态获取。
审计日志：确保Haath网关、Waterfall以及你自己的ASMP服务器都开启了详细的审计日志。记录下每个状态的转换、每个工具的调用（参数和结果）、每个LLM请求和响应。这对于事后分析、调试和安全审计至关重要。

构建基于Haath的智能体，是一个将模糊的AI能力工程化为可靠、可控、可运营的软件系统的过程。它要求开发者从设计“工作流”和“状态”的角度去思考问题，而不是一味地追求模型的“全能”。这种约束，恰恰是通往真正实用、可信赖的AI应用的一条坚实路径。

查看全文

http://www.jsqmd.com/news/792677/