当前位置: 首页 > news >正文

Hello-Agents阅读笔记--基础篇--智能体的构成和运行原理

1.2 智能体的构成与运行原理

1.2.1 任务环境定义

要理解智能体的运作,我们必须先理解它所处的任务环境。在人工智能领域,通常使用PEAS 模型来精确描述一个任务环境,即分析其性能度量(Performance)、环境(Environment)、执行器(Actuators)和传感器(Sensors)。以上文提到的智能旅行助手为例,下表 1.2 展示了如何运用 PEAS 模型对其任务环境进行规约。

在实践中,LLM 智能体所处的数字环境展现出若干复杂特性,这些特性直接影响着智能体的设计。

首先,环境通常是部分可观察的。例如,旅行助手在查询航班时,无法一次性获取所有航空公司的全部实时座位信息。它只能通过调用航班预订 API,看到该 API 返回的部分数据,这就要求智能体必须具备记忆(记住已查询过的航线)和探索(尝试不同的查询日期)的能力。

其次,行动的结果也并非总是确定的。根据结果的可预测性,环境可分为确定性随机性。旅行助手的任务环境就是典型的随机性环境。当它搜索票价时,两次相邻的调用返回的机票价格和余票数量都可能不同,这就要求智能体必须具备处理不确定性、监控变化并及时决策的能力。

此外,环境中还可能存在其他行动者,从而形成多智能体(Multi-agent)环境。对于旅行助手而言,其他用户的预订行为、其他自动化脚本,甚至航司的动态调价系统,都是环境中的其他“智能体”。它们的行动(例如,订走最后一张特价票)会直接改变旅行助手所处环境的状态,这对智能体的快速响应和策略选择提出了更高要求。

最后,几乎所有任务都发生在序贯动态的环境中。“序贯”意味着当前动作会影响未来;而“动态”则意味着环境自身可能在智能体决策时发生变化。这就要求智能体的“感知-思考-行动-观察”循环必须能够快速、灵活地适应持续变化的世界。

1.2.2 智能体的运行机制

在定义了智能体所处的任务环境后,我们来探讨其核心的运行机制。智能体并非一次性完成任务,而是通过一个持续的循环与环境进行交互,这个核心机制被称为智能体循环 (Agent Loop)。如图 1.5 所示,该循环描述了智能体与环境之间的动态交互过程,构成了其自主行为的基础。

这个循环主要包含以下几个相互关联的阶段:

  1. 感知 (Perception):这是循环的起点。智能体通过其传感器(例如,API 的监听端口、用户输入接口)接收来自环境的输入信息。这些信息,即观察 (Observation),既可以是用户的初始指令,也可以是上一步行动所导致的环境状态变化反馈。

  2. 思考 (Thought)

    :接收到观察信息后,智能体进入其核心决策阶段。对于 LLM 智能体而言,这通常是由大语言模型驱动的内部推理过程。如图所示,“思考”阶段可进一步细分为两个关键环节:

    • 规划 (Planning):智能体基于当前的观察和其内部记忆,更新对任务和环境的理解,并制定或调整一个行动计划。这可能涉及将复杂目标分解为一系列更具体的子任务。
    • 工具选择 (Tool Selection):根据当前计划,智能体从其可用的工具库中,选择最适合执行下一步骤的工具,并确定调用该工具所需的具体参数。
  3. 行动 (Action):决策完成后,智能体通过其执行器(Actuators)执行具体的行动。这通常表现为调用一个选定的工具(如代码解释器、搜索引擎 API),从而对环境施加影响,意图改变环境的状态。

行动并非循环的终点。智能体的行动会引起环境 (Environment)状态变化 (State Change),环境随即会产生一个新的观察 (Observation)作为结果反馈。这个新的观察又会在下一轮循环中被智能体的感知系统捕获,形成一个持续的“感知-思考-行动-观察”的闭环。智能体正是通过不断重复这一循环,逐步推进任务,从初始状态向目标状态演进。

1.2.3 智能体的感知与行动

在工程实践中,为了让 LLM 能够有效驱动这个循环,我们需要一套明确的交互协议 (Interaction Protocol)来规范其与环境之间的信息交换。

在许多现代智能体框架中,这一协议体现在对智能体每一次输出的结构化定义上。智能体的输出不再是单一的自然语言回复,而是一段遵循特定格式的文本,其中明确地展示了其内部的推理过程与最终决策。

这个结构通常包含两个核心部分:

  • Thought (思考):这是智能体内部决策的“快照”。它以自然语言形式阐述了智能体如何分析当前情境、回顾上一步的观察结果、进行自我反思与问题分解,并最终规划出下一步的具体行动。
  • Action (行动):这是智能体基于思考后,决定对环境施加的具体操作,通常以函数调用的形式表示。

例如,一个正在规划旅行的智能体可能会生成如下格式化的输出:

Thought: 用户想知道北京的天气。我需要调用天气查询工具。 Action: get_weather("北京")Copy to clipboardErrorCopied

这里的Action字段构成了对外部世界的指令。一个外部的解析器 (Parser)会捕捉到这个指令,并调用相应的get_weather函数。

行动执行后,环境会返回一个结果。例如,get_weather函数可能返回一个包含详细天气数据的 JSON 对象。然而,原始的机器可读数据(如 JSON)通常包含 LLM 无需关注的冗余信息,且格式不符合其自然语言处理的习惯。

因此,感知系统的一个重要职责就是扮演传感器的角色:将这个原始输出处理并封装成一段简洁、清晰的自然语言文本,即观察。

Observation: 北京当前天气为晴,气温25摄氏度,微风。Copy to clipboardErrorCopied

这段Observation文本会被反馈给智能体,作为下一轮循环的主要输入信息,供其进行新一轮的ThoughtAction

综上所述,通过这个由 Thought、Action、Observation 构成的严谨循环,LLM 智能体得以将内部的语言推理能力,与外部环境的真实信息和工具操作能力有效地结合起来。

http://www.jsqmd.com/news/507542/

相关文章:

  • 时序 KAN 持续发力!靠它人人都能水一篇,此时不冲,更待何时!
  • SAP选择屏幕隐藏selection options的常见问题及解决方案
  • 2026年江苏无锡抖音推广公司TOP5名单出炉,盘点本地服务格局现状 - 精选优质企业推荐榜
  • 从流量包到攻击链:一次APT攻击的深度取证WriteUp
  • 推荐一个高效学习SpringBoot的方法!
  • Ubuntu-无网络环境下快速部署开发环境(gcc、make、dkms等)
  • 产品经理必看!用Draw.io快速绘制专业状态流转图(含电商订单案例)
  • 羊绒衫定制如何找到可靠厂家?2026年优质推荐涵盖OEM与ODM专业服务 - 品牌推荐
  • 微信小程序中实现气泡提示框、图片css加载动画及容错处理
  • 2026化工领域钢衬四氟储罐优质厂家推荐榜 - 资讯焦点
  • 标签多伯努利滤波器(LMB):多目标跟踪中的身份一致性保障机制
  • 深入解析set_max_delay与set_min_delay在异步电路时序约束中的关键作用
  • 工业设计赋能:CYBER-VISION零号协议解读与生成SolidWorks设计注释
  • 壹方设计电话查询:获取联系方式的实用建议 - 品牌推荐
  • 摒弃有害厨具,京尚黑科技陶瓷锅,开启高端健康烹饪时代
  • SpringBoot如何快速精通?
  • Cortex-M3 特色功能——位带操作(Bit-Band)
  • 商店盗窃行为破窗行为商品安防检测数据集VOC+YOLO格式2173张1类别
  • 2026环保合规纸塑染料助剂优质厂家推荐 - 资讯焦点
  • Qwen3.5-9B图文对话精彩案例:上传电路图问原理、传PPT页问逻辑漏洞
  • 免费获取乡镇级GeoJson边界数据的3种实用方法
  • 气熙B7空气净化器电话查询:使用前需了解的关键注意事项 - 品牌推荐
  • 长寿命检测开关的新选择:ALPS SPVT210101 VS 国产替代 TONEVEE KFC-VT-318BY 高达2万次寿命
  • 履霜坚冰,龙战于野:当权力失去约束,欲望成为人性的灾难
  • AES算法解剖课:用MATLAB逐行还原字节代换/行位移的数学之美
  • PyTorch中autograd.Function.apply的5个实战技巧(附自定义ReLU实现)
  • Acme .NET 工具类库:一站式解决.NET开发高频场景问题
  • 室内要素识别建筑物内部地面墙壁天花板识别分割数据集labelme格式1031张3类别
  • 2026年消防桥架厂家推荐:防火/镀锌/大跨度/节能桥架专业供应商精选——郑州畅通机电有限公司 - 品牌推荐官
  • 2026 SRM 系统深度测评:鲸采云凭自定义适配多行业采购场景