当前位置: 首页 > news >正文

上下文工程

View Post

上下文工程

为何上下文工程对智能体至关重要

AI智能体的核心工作模式是在LLM调用和工具调用之间进行循环,利用工具的反馈来决定下一步行动。这个过程天然地会产生大量上下文信息。

 

随着任务的进行,来自工具调用的上下文会不断累积,迅速膨胀。这种“上下文溢出”会直接导致多种严重问题:

超出上下文窗口限制:当Token数量超过模型上限时,程序会崩溃或丢失重要信息。

成本与延迟激增:增加API调用成本,更长的响应时间。

性能下降:过长或混乱的上下文影响模型推理能力

具体表现为:

  • 上下文中毒:一个错误的幻觉信息进入上下文,并污染后续的推理过程。
  • 上下文分心:海量信息淹没了模型的训练知识,使其偏离核心任务。
  • 上下文混淆:无关的上下文信息对模型的响应产生了负面影响。
  • 上下文冲突 :上下文中存在相互矛盾的信息,导致模型决策混乱。

 

上下文工程的四大核心策略

涌现出四大类上下文工程策略:写入(Write)、选择(Select)、压缩(Compress) 和 隔离(Isolate)。

 

 

压缩上下文 

  • 上下文总结
  • 上下文裁剪,移除消息列表中最旧的消息

 

隔离上下文

多智能体架构 (Multi-agent) 将一个复杂任务分解给多个专职子智能体是隔离上下文最流行的方式。每个子智能体都有自己独立的上下文窗口,工具。

 

 

 

LangChain: 剖析”上下文工程”的四大核心策略和实践技巧