当前位置：首页 > news >正文

Hello-Agents阅读笔记--基础篇--智能体的构成和运行原理

news 2026/3/27 1:58:40

1.2 智能体的构成与运行原理

1.2.1 任务环境定义

要理解智能体的运作，我们必须先理解它所处的任务环境。在人工智能领域，通常使用PEAS 模型来精确描述一个任务环境，即分析其性能度量(Performance)、环境(Environment)、执行器(Actuators)和传感器(Sensors)。以上文提到的智能旅行助手为例，下表 1.2 展示了如何运用 PEAS 模型对其任务环境进行规约。

在实践中，LLM 智能体所处的数字环境展现出若干复杂特性，这些特性直接影响着智能体的设计。

首先，环境通常是部分可观察的。例如，旅行助手在查询航班时，无法一次性获取所有航空公司的全部实时座位信息。它只能通过调用航班预订 API，看到该 API 返回的部分数据，这就要求智能体必须具备记忆（记住已查询过的航线）和探索（尝试不同的查询日期）的能力。

其次，行动的结果也并非总是确定的。根据结果的可预测性，环境可分为确定性和随机性。旅行助手的任务环境就是典型的随机性环境。当它搜索票价时，两次相邻的调用返回的机票价格和余票数量都可能不同，这就要求智能体必须具备处理不确定性、监控变化并及时决策的能力。

此外，环境中还可能存在其他行动者，从而形成多智能体(Multi-agent)环境。对于旅行助手而言，其他用户的预订行为、其他自动化脚本，甚至航司的动态调价系统，都是环境中的其他“智能体”。它们的行动（例如，订走最后一张特价票）会直接改变旅行助手所处环境的状态，这对智能体的快速响应和策略选择提出了更高要求。

最后，几乎所有任务都发生在序贯且动态的环境中。“序贯”意味着当前动作会影响未来；而“动态”则意味着环境自身可能在智能体决策时发生变化。这就要求智能体的“感知-思考-行动-观察”循环必须能够快速、灵活地适应持续变化的世界。

1.2.2 智能体的运行机制

在定义了智能体所处的任务环境后，我们来探讨其核心的运行机制。智能体并非一次性完成任务，而是通过一个持续的循环与环境进行交互，这个核心机制被称为智能体循环 (Agent Loop)。如图 1.5 所示，该循环描述了智能体与环境之间的动态交互过程，构成了其自主行为的基础。

这个循环主要包含以下几个相互关联的阶段：

感知 (Perception)：这是循环的起点。智能体通过其传感器（例如，API 的监听端口、用户输入接口）接收来自环境的输入信息。这些信息，即观察 (Observation)，既可以是用户的初始指令，也可以是上一步行动所导致的环境状态变化反馈。
思考 (Thought)
：接收到观察信息后，智能体进入其核心决策阶段。对于 LLM 智能体而言，这通常是由大语言模型驱动的内部推理过程。如图所示，“思考”阶段可进一步细分为两个关键环节：
- 规划 (Planning)：智能体基于当前的观察和其内部记忆，更新对任务和环境的理解，并制定或调整一个行动计划。这可能涉及将复杂目标分解为一系列更具体的子任务。
- 工具选择 (Tool Selection)：根据当前计划，智能体从其可用的工具库中，选择最适合执行下一步骤的工具，并确定调用该工具所需的具体参数。
行动 (Action)：决策完成后，智能体通过其执行器（Actuators）执行具体的行动。这通常表现为调用一个选定的工具（如代码解释器、搜索引擎 API），从而对环境施加影响，意图改变环境的状态。

行动并非循环的终点。智能体的行动会引起环境 (Environment)的状态变化 (State Change)，环境随即会产生一个新的观察 (Observation)作为结果反馈。这个新的观察又会在下一轮循环中被智能体的感知系统捕获，形成一个持续的“感知-思考-行动-观察”的闭环。智能体正是通过不断重复这一循环，逐步推进任务，从初始状态向目标状态演进。

1.2.3 智能体的感知与行动

在工程实践中，为了让 LLM 能够有效驱动这个循环，我们需要一套明确的交互协议 (Interaction Protocol)来规范其与环境之间的信息交换。

在许多现代智能体框架中，这一协议体现在对智能体每一次输出的结构化定义上。智能体的输出不再是单一的自然语言回复，而是一段遵循特定格式的文本，其中明确地展示了其内部的推理过程与最终决策。

这个结构通常包含两个核心部分：

Thought (思考)：这是智能体内部决策的“快照”。它以自然语言形式阐述了智能体如何分析当前情境、回顾上一步的观察结果、进行自我反思与问题分解，并最终规划出下一步的具体行动。
Action (行动)：这是智能体基于思考后，决定对环境施加的具体操作，通常以函数调用的形式表示。

例如，一个正在规划旅行的智能体可能会生成如下格式化的输出：

Thought: 用户想知道北京的天气。我需要调用天气查询工具。 Action: get_weather("北京")Copy to clipboardErrorCopied

这里的Action字段构成了对外部世界的指令。一个外部的解析器 (Parser)会捕捉到这个指令，并调用相应的get_weather函数。

行动执行后，环境会返回一个结果。例如，get_weather函数可能返回一个包含详细天气数据的 JSON 对象。然而，原始的机器可读数据（如 JSON）通常包含 LLM 无需关注的冗余信息，且格式不符合其自然语言处理的习惯。

因此，感知系统的一个重要职责就是扮演传感器的角色：将这个原始输出处理并封装成一段简洁、清晰的自然语言文本，即观察。

Observation: 北京当前天气为晴，气温25摄氏度，微风。Copy to clipboardErrorCopied

这段Observation文本会被反馈给智能体，作为下一轮循环的主要输入信息，供其进行新一轮的Thought和Action。

综上所述，通过这个由 Thought、Action、Observation 构成的严谨循环，LLM 智能体得以将内部的语言推理能力，与外部环境的真实信息和工具操作能力有效地结合起来。

查看全文

http://www.jsqmd.com/news/507542/

时序 KAN 持续发力！靠它人人都能水一篇，此时不冲，更待何时！

SAP选择屏幕隐藏selection options的常见问题及解决方案

2026年江苏无锡抖音推广公司TOP5名单出炉，盘点本地服务格局现状 - 精选优质企业推荐榜

从流量包到攻击链：一次APT攻击的深度取证WriteUp

推荐一个高效学习SpringBoot的方法！

Ubuntu-无网络环境下快速部署开发环境（gcc、make、dkms等）

产品经理必看！用Draw.io快速绘制专业状态流转图（含电商订单案例）

羊绒衫定制如何找到可靠厂家？2026年优质推荐涵盖OEM与ODM专业服务 - 品牌推荐

微信小程序中实现气泡提示框、图片css加载动画及容错处理

2026化工领域钢衬四氟储罐优质厂家推荐榜 - 资讯焦点

标签多伯努利滤波器（LMB）：多目标跟踪中的身份一致性保障机制

深入解析set_max_delay与set_min_delay在异步电路时序约束中的关键作用

工业设计赋能：CYBER-VISION零号协议解读与生成SolidWorks设计注释

壹方设计电话查询：获取联系方式的实用建议 - 品牌推荐

摒弃有害厨具，京尚黑科技陶瓷锅，开启高端健康烹饪时代

SpringBoot如何快速精通？

Cortex-M3 特色功能——位带操作（Bit-Band）

商店盗窃行为破窗行为商品安防检测数据集VOC+YOLO格式2173张1类别

2026环保合规纸塑染料助剂优质厂家推荐 - 资讯焦点

Qwen3.5-9B图文对话精彩案例：上传电路图问原理、传PPT页问逻辑漏洞

免费获取乡镇级GeoJson边界数据的3种实用方法

气熙B7空气净化器电话查询：使用前需了解的关键注意事项 - 品牌推荐

长寿命检测开关的新选择：ALPS SPVT210101 VS 国产替代 TONEVEE KFC-VT-318BY 高达2万次寿命

履霜坚冰，龙战于野：当权力失去约束，欲望成为人性的灾难

AES算法解剖课：用MATLAB逐行还原字节代换/行位移的数学之美

PyTorch中autograd.Function.apply的5个实战技巧（附自定义ReLU实现）

Acme .NET 工具类库：一站式解决.NET开发高频场景问题

室内要素识别建筑物内部地面墙壁天花板识别分割数据集labelme格式1031张3类别

2026 SRM 系统深度测评：鲸采云凭自定义适配多行业采购场景

1.2 智能体的构成与运行原理

1.2.1 任务环境定义

1.2.2 智能体的运行机制

1.2.3 智能体的感知与行动

相关文章：