当前位置: 首页 > news >正文

深度解析上下文工程:大模型架构师的核心技能(建议收藏)

视觉化解读

上下文工程正变得越来越重要,但我们觉得很多人仍然难以真正理解它的实际含义。

今天,让我们以逐步的方式来全面了解上下文工程的一切!

我们开始吧!


简单来说,上下文工程就是一门艺术兼科学,其核心是在恰当的时间、以恰当的形式,将恰当的信息提供给你的LLM。

以下是Andrej Karpathy关于上下文工程的一段引语…

要理解上下文工程,首先必须理解上下文的含义。

如今的智能体已经演变成远不止聊天机器人。

下图总结了智能体正常运作所需的六种上下文类型,它们是:

注:在人工智能领域,“上下文”通常指模型处理任务时参考的额外信息,如用户输入的背景或历史数据;“智能体”则指能够自主感知环境、决策并行动的AI系统,例如基于大语言模型的程序,这些概念是理解上下文工程的关键。

  • 指令
  • 示例
  • 知识
  • 记忆
  • 工具
  • 护栏

这告诉你,仅仅“提示”智能体是不够的。

你必须对输入(上下文)进行工程化。

这样想:

  • 如果LLM是CPU。
  • 那么上下文窗口就是RAM。

本质上,你是在用完美的指令为你的人工智能编“RAM”。

我们该怎么做呢?

上下文工程可以分解为4个基本阶段:

这里的比喻将大语言模型(LLM)比作计算机的中央处理器(CPU),上下文窗口比作随机存取存储器(RAM)。CPU负责处理信息,RAM存储当前使用的数据;类似地,LLM处理输入指令,上下文窗口则提供处理所需的信息。通过精心设计上下文(编程“RAM”),我们可以优化AI的性能和输出。

|

  • 编写上下文
  • 选择上下文
  • 压缩上下文
  • 隔离上下文

让我们逐一理解每个阶段…

1) 编写上下文:

编写上下文指的是将上下文保存在上下文窗口之外,以帮助智能体执行任务。

:上下文窗口(context window)指大语言模型处理输入时能考虑的最大文本长度,类似于计算机内存。智能体(agent)在人工智能中指能够感知环境并自主执行任务的系统,如聊天机器人或自动化程序。

您可以通过将其写入以下位置来实现:

  • 长期记忆(跨会话持久保存)
  • 短期记忆(在会话内持久保存)
  • 状态对象
2) 读取上下文:

读取上下文指的是将其拉入上下文窗口,以帮助智能体执行任务。

上下文窗口是大语言模型(LLM)中一次性能处理的文本序列的最大长度。将上下文拉入窗口意味着使模型能够访问这些信息以进行推理或生成。

这个上下文可以从以下来源拉取:

  • 工具
  • 内存
  • 知识(文档,向量数据库)
3) 压缩上下文

压缩上下文意味着只保留任务所需的token。

“知识”在这里指用于存储信息的数据库,如文档或向量数据库,后者专门处理高维向量数据,常用于机器学习中的相似性搜索。
“压缩上下文”是一种优化技术,通过筛选输入数据,仅保留对当前任务最重要的部分,以减少计算开销并提高效率。而“token”是大语言模型处理文本时的基本单位,通常对应单词或子词。

检索到的上下文可能包含重复或冗余信息(例如多轮工具调用),从而增加额外token消耗和成本。

上下文总结在这里能发挥作用。

4) 隔离上下文

隔离上下文涉及将其分割开来,以帮助智能体执行任务。

一些流行的实现方式包括:

  • 使用多个智能体(或子智能体),每个都有其自己的上下文
  • 使用沙盒环境来存储和执行代码
  • 以及使用一个状态对象

因此,本质上,当你构建一个上下文工程工作流时,你是在工程化一个“上下文”管道,以便让大语言模型在正确的时间、以正确的格式看到正确的信息。

这正是上下文工程的工作原理!

就像你工程化特征以使机器学习模型工作一样…

  • 那些对输出没有贡献的特征应该被移除
  • 高度相关的特征在某些情况下可能帮助不大,等等…

…类似地,你工程化大语言模型的上下文,使其能够准确响应。

特征工程是数据科学中预处理数据的关键步骤,通过选择和构造相关特征来提升模型性能。类比到上下文工程,是通过设计输入上下文的结构和内容来优化大语言模型的输出。

最后唠两句

为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选

很简单,这些岗位缺人且高薪

智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

那0基础普通人如何学习大模型 ?

深耕科技一线十二载,亲历技术浪潮变迁。我见证那些率先拥抱AI的同行,如何建立起效率与薪资的代际优势。如今,我将积累的大模型面试真题、独家资料、技术报告与实战路线系统整理,分享于此,为你扫清学习困惑,共赴AI时代新程。

我整理出这套 AI 大模型突围资料包【允许白嫖】:

  • ✅从入门到精通的全套视频教程

  • ✅AI大模型学习路线图(0基础到项目实战仅需90天)

  • ✅大模型书籍与技术文档PDF

  • ✅各大厂大模型面试题目详解

  • ✅640套AI大模型报告合集

  • ✅大模型入门实战训练

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(0基础到项目实战仅需90天)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

http://www.jsqmd.com/news/325270/

相关文章:

  • 食品安全金属探测仪专用屏优选!恒域威四大优势,筑牢食品质检防线
  • 双泵程序(定时轮换)功能块 博图程序 一主一备 SCL功能块,博图16编写,可使用于其他支持S...
  • AI智能体(AI Agents)全解析:大模型时代的智能系统设计与实战指南
  • 基于springboot的超能驾校线上学习管理系统的设计与实现
  • [负载均衡] Ribbon DynamicServerListLoadBalancer 组件详解
  • 河南黄酒有哪些功效与作用,豫东森黄酒口碑如何
  • 南港潮汐表查询2026-02-01
  • 基于springboot的植物健康管理系统设计实现
  • 互联网大厂Java面试实录:核心技术栈与AIGC场景深度解析
  • 基于springboot的智能垃圾分类管理系统设计实现
  • 聊聊口碑好的河南黄酒,东森药食同源性价比超高你知道吗
  • 亲测好用!8款AI论文网站测评:本科生毕业论文全攻略
  • 实战笔记:西门子1500PLC在汽车焊装线的架构设计
  • 2026年可靠的冷库货架厂家推荐,专业的公司怎么选
  • 今年推荐靠谱的全自动穴盘播种机生产厂,选购别错过
  • 聊聊佛山企业食堂餐具精品定制,哪家性价比高
  • 2026年深圳好用的GEO产品推荐,服务联系方式大公开
  • AI写论文别愁啦!这4款AI论文生成利器,高效完成论文写作!
  • 2026年佛山市联友邦精密机械价格大揭秘
  • 本科论文焦虑退散!百考通AI助你高效通关,这些智能工具更配了
  • 探寻穴盘播种机源头厂家哪家口碑好,经验分享
  • [负载均衡] Ribbon LoadBalancer 之 DynamicServerListLoadBalancer 组件详解
  • 百考通AI:每日200篇免费AI检测,你的论文合规“预审官”
  • 麻将机哪个品牌更可靠?2026年麻将机品牌推荐与排名,解决稳定性与售后核心痛点
  • MoE混合专家模型揭秘:A3B到底是什么?看完这篇,小白也能变专家
  • 聊聊佛山市联友邦精密机械有限公司,价格贵不贵?
  • 智能照明(有完整资料)
  • AT_arc204_a [ARC204A] Use Udon Coupon
  • 2026年探究科大能通口碑,产品优势与价格费用全解析
  • 自动门(有完整资料)