当前位置：首页 > news >正文

AI代理：从单轮到长期运行

news 2026/7/4 1:04:57

代理正在从聊天机器人成长为长期运行的同事，可以读取数据、运行代码并交付实际工件。本文介绍了如何使用技能、shell 和压缩来以干净、可靠的方式构建这些代理。

大多数"AI 助手"今天回答一个问题然后停止。长期运行的代理处理完整的工作流程：读取大型数据集、更新文件，甚至在多个步骤中编写应用程序。

OpenClaw（以前的 Clawdbot）是朝着这个方向迈出的一步，这并不是第一个。已经有许多项目在开发中，使长期运行的代理处理复杂任务，需要多步骤工作流程执行。

OpenAI 最新的代理堆栈为此添加了三个支柱：

技能：模型可以在需要时加载的可重用过程。
Shell：用于运行代码和编写文件的实际执行环境。
压缩：自动上下文管理，使长对话不会中断。
这些新功能的组合将让你构建的代理行为更像是一个遵循剧本并使用真实计算机运行多个任务以实现目标的人类，而不是单轮的聊天窗口。

下面是对其中每一个的详细解释。

技能是一个文件文件夹加上一个 SKILL.md 清单，描述如何执行特定工作流程。你可以将其视为代理可以按需挂载和遵循的版本化剧本或标准操作程序。

技能由 Anthropic (Claude AI) 作为将可重用指南分配给代理的开放标准而推出。

例如，你希望代理收集新闻。但只是提到这一点，代理会产生很多幻觉。你将有一组指令，比如如何浏览、浏览什么、如何响应或总结新闻，所有这些组合成一个带有要做和不要做的单一提示，将成为代理的技能。

当技能可用时，平台向模型公开三个关键字段：

没有技能，你经常最终将所有内容塞进一个巨大的系统提示中。这会损害可靠性，使更新变得痛苦，并浪费令牌。

技能通过以下方式解决了这个问题：

Shell 工具让代理在真实的终端环境中工作，而不仅仅是虚拟对话。

主要有两种模式：

托管 shell：由 OpenAI 在云中管理的容器。
本地 shell：你自己运行的运行时，但遵循相同的工具语义。
在这两种情况下，代理都可以安装依赖项、运行脚本并将输出写入磁盘。Shell 与 Responses API 集成，因此你仍然具有有状态运行、工具调用和多轮工作流程。

为什么 shell 强大？

通过 shell 访问，代理可以：

当代理工作数十或数百轮时，你很快会达到模型的上下文窗口限制。在没有帮助的情况下，你必须手动修剪或总结历史记录，这容易出错。

压缩自动执行此操作：

随着运行的增长，旧部分被压缩，同时保留关键事实。
代理可以继续工作，而无需你手动编辑对话。
在 Responses API 中，压缩以两种形式出现：
服务器端压缩（新）：当上下文超过阈值时自动在流中运行。
独立的/responses/compact端点：让你在想要显式控制时手动触发压缩。
将压缩用作默认原语可以保持长期工作流程的稳定性，并减少"从头开始"的时刻。