当前位置: 首页 > news >正文

什么是上下文工程(Context Engineering)?一文搞清楚

随着大语言模型(LLM)在智能体(Agent)系统中的广泛应用,如何有效管理有限的上下文窗口(Context Window)成为关键挑战。

01

为什么需要上下文工程?

大语言模型的上下文窗口类似于计算机的 RAM——它是模型的“工作记忆”,但容量有限。当智能体执行长期任务时,会不断累积以下类型的上下文:

  • 指令(Instructions):提示词、记忆、少样本示例、工具描述等

  • 知识(Knowledge):事实、用户偏好、历史信息等

  • 工具反馈(Tools):API 调用结果、代码执行输出等

长期执行的任务和工具调用反馈的积累意味着智能体通常会使用大量令牌。 这可能引发多种问题:可能超过上下文窗口大小、导致成本或延迟急剧上升,或降低智能体性能。

随着交互轮次增加,上下文迅速膨胀,可能引发以下问题:

问题类型

描述

上下文中毒(Context Poisoning)

幻觉内容被写入上下文,污染后续推理

上下文干扰(Context Distraction)

过多无关信息压倒模型对核心任务的关注

上下文混淆(Context Confusion)

冗余或矛盾信息导致输出不一致

上下文冲突(Context Clash)

上下文中存在相互矛盾的事实或指令

上下文工程已成为构建可靠、高效智能体的首要任务.

02

上下文工程的四大核心策略

为应对上述挑战,业界普遍采用以下四类策略:

  • 写入上下文(Write)

  • 选择上下文(Select)

  • 压缩上下文(Compress)

  • 隔离上下文(Isolate)

2.1 写入上下文(Write)

将重要信息 保存到上下文窗口之外 ,供后续使用。

Scratchpad(草稿板):在单次会话中临时存储计划、中间结论等。例如 Anthropic 的多智能体研究系统中,主研究员会将研究计划写入 Memory,防止因上下文截断而丢失。

实现方式:通过工具调用写入文件,或存入运行时状态对象(State)。

长期记忆(Memories):跨会话持久化信息。

应用实例:ChatGPT、Cursor、Windsurf 均支持自动生成用户专属长期记忆。

2.2 选择上下文(Select)

动态检索最相关的信息 注入当前上下文。

从 Scratchpad 选择:若以 State 存储,开发者可控制每步暴露哪些字段;若以工具实现,则通过读取工具调用获取。

记忆检索:

  • 程序性记忆(Procedural):如 CLAUDE.md 、规则文件,用于指导行为。

  • 情景性记忆(Episodic):少样本示例。

  • 语义性记忆(Semantic):事实知识,通常通过 向量嵌入 或 知识图谱 进行检索。

工具选择:对大量工具使用 RAG 技术,仅检索与当前任务最相关的工具描述,可提升工具选择准确率。

知识检索(RAG):尤其在代码智能体中,需结合 AST 解析、文件搜索、知识图谱与重排序等多种技术,而非仅依赖向量搜索。

2.3 压缩上下文(Compress)

保留完成任务所需的最少 token 。

上下文摘要(Summarization):

  • 在接近上下文上限时,对整个对话轨迹进行递归或分层摘要。

  • 可在特定节点(如耗 token 的搜索工具后)插入摘要步骤。

  • 复杂场景下甚至需微调专用摘要模型。

上下文修剪(Trimming/Pruning):

  • 基于启发式规则(如删除最早消息)。

  • 或使用训练好的上下文剪枝器。

2.4 隔离上下文(Isolate)

将上下文拆分,避免相互干扰 。

多智能体架构:

  • 每个子智能体拥有独立上下文窗口、工具集和指令(如 OpenAI Swarm、Anthropic 多智能体研究系统)。

  • 优势:专注子任务,减少干扰;可并行探索。

  • 挑战:总 token 消耗可能激增(Anthropic 报告达普通聊天的 15 倍),需精心设计协调机制。

环境隔离(Sandboxing):

  • 如 Hugging Face 的 Deep Research 使用 CodeAgent,在沙箱中执行代码,仅将必要结果(如变量值)返回 LLM。

  • 避免将大型对象(图像、音频)直接塞入上下文。

状态对象隔离:

  • 通过结构化 State Schema,将不同信息存入不同字段(如 messages 、 plan 、 tool_results ),仅在需要时暴露给 LLM

03

LangGraph:上下文工程的实践框架

LangGraph 作为低层智能体编排框架,原生支持上述所有策略:

策略

LangGraph 支持方式

Write

短期记忆:通过 Checkpoint 持久化 State(即 Scratchpad)
长期记忆:支持文件存储(Profile)或向量集合(Collection),集成 LangMem

Select

每个节点可精细控制传入 LLM 的 State 字段
长期记忆支持嵌入检索
LangGraph BigTool 库实现工具描述的语义检索

Compress

内置消息列表摘要/修剪工具
可自定义节点对工具输出或阶段结果进行压缩

Isolate

State Schema 天然支持上下文隔离
支持 E2B/Pyodide 沙箱执行
提供 Supervisor、Swarm 等多智能体模板

上下文工程已从“技巧”演变为 智能体开发的核心工程学科 。面对有限的上下文窗口与复杂的任务需求,开发者必须像操作系统管理内存一样,精心调度每一条信息的“生命周期”——何时写入、如何选择、是否压缩、怎样隔离。

上下文工程不是 “越多信息越好”,也不是 “越少信息越省”,而是在每个任务步骤中,让 Agent 获得 “刚刚好” 的信息。

最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

如果你也想通过学大模型技术去帮助自己升职和加薪,可以扫描下方链接👇👇
​​

为什么我要说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。


智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200%,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

​​

资料包有什么?

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解


⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

http://www.jsqmd.com/news/345996/

相关文章:

  • AI岗位薪资真相与大模型系统化学习全攻略_AI大模型岗位薪资真相:多少年包能拿到?普通人如何破局?
  • 设计师狂喜!图片转换王绿色版 专业格式通吃 8 线程极速批量转换
  • 66.搜索旋转数组
  • 教学演示首选!4K 高清录屏神器 免费汉化无广告 自带标注工具
  • 完整教程:C++继承基础:继承中的默认成员函数-静态成员变量-与友元(二)
  • 808KB 轻量王者!Gif123 免费开源 GIF 录屏神器 录编压转一站式搞定
  • Web 实现多组件同步滚动
  • 10 年经典不褪色!美明定时助手 4M 免费无广告 多任务定时超实用
  • 智能健康监测手环设计
  • 为何云卓科技C11吊舱能适配多种规格载具?
  • 智能浇花系统的设计
  • AI智能识别人脸情绪项目
  • 亲测好用! 降AIGC软件 千笔·降AI率助手 VS 学术猹,继续教育首选
  • 【开题答辩全过程】以 基于Python的茶叶销售数据可视化分析系统设计实现为例,包含答辩的问题和答案
  • 剖析黑龙江汽车噪音治理,各品牌价格与服务对比排名 - 工业品牌热点
  • leetcode 904. Fruit Into Baskets 水果成篮
  • 【开题答辩全过程】以 基于PHP的发热病人管理平台的设计与实现为例,包含答辩的问题和答案
  • 设计稿还原为什么总是出问题?一次设计转代码的实测分享
  • 2026年深圳婚姻纠纷律师联系电话推荐:可靠律师资源与沟通建议 - 品牌推荐
  • 2026年深圳离婚律师联系电话推荐:五大优选律师介绍 - 品牌推荐
  • 脚本双雄:Bash vs Python,谁才是你开发的“灵魂伴侣” ?
  • 2026年深圳婚姻纠纷律师联系电话推荐:专业律师资源全览 - 品牌推荐
  • 写作压力小了!10个降AIGC平台测评:专科生如何选才能降AI率过关?
  • 2026年成都靠谱的制袋机公司盘点,华裕托盘袋制袋机实力大揭秘 - myqiye
  • 了解迪拜房产相关资讯,时代出国成功案例多不多? - 工业设备
  • 两级电力市场环境下计及风险的省间交易商最优购电模型
  • 2026年探讨高性价比的聚氨酯筛板工厂,为您节省成本 - 工业推荐榜
  • 2026年深圳离婚纠纷律师联系电话推荐:专业团队联系指引 - 品牌推荐
  • docker拉取代理脚本
  • 靠谱的医药车间净化板漆面修复公司有哪些 - 工业品网