当前位置: 首页 > news >正文

Agent进化史:从被动应答到主动规划

在 Agent(智能体)成为主流之前,AI 大模型领域其实已经积累了深厚的技术底座。简单来说,Agent 是把这些成熟技术“串联”起来,赋予了 AI 主动规划、使用工具和记忆的能力。

以下是 Agent 出现之前,大模型及相关领域的核心技术栈:

1. 基础架构与训练范式

这是大模型的“地基”,决定了模型能“懂”多少知识。

  • Transformer 架构:2017 年提出的自注意力机制(Self-Attention),彻底取代了 RNN/LSTM,让模型能并行处理长序列,是当今所有大模型的基石。
  • 预训练(Pre-training):让模型在海量无标注数据上“自学”,掌握语言规律、世界常识和逻辑推理。这是大模型“聪明”的来源。
  • 指令微调(Instruction Tuning):让模型学会“听懂人话”并执行指令,而不仅仅是续写文本。这是 Chatbot 时代的开端。
  • 人类对齐(RLHF/RLAIF):通过强化学习,让模型输出符合人类价值观、安全且有用。这是让模型“懂事”的关键。

2. 核心交互技术

在 Agent 出现前,模型主要靠这些技术与人类“对话”。

  • 提示工程(Prompt Engineering)
    • 零样本/少样本学习(Zero/Few-shot):通过巧妙的提问方式,让模型在不训练的情况下完成特定任务。
    • 思维链(Chain-of-Thought, CoT):引导模型“一步步思考”,极大地提升了复杂推理(如数学题、逻辑题)的能力。
  • 上下文窗口(Context Window):从最初的几千 token 扩展到现在的十几万甚至百万 token,让模型能“阅读”整本书或长文档,但这依然属于被动记忆。

3. 应用层关键技术

在 Agent 能“自主行动”之前,人们主要靠这些技术让模型“干活”。

  • RAG(检索增强生成)
    • 模型本身记不住私有数据或最新新闻,RAG 技术让模型先“去数据库查资料”,再根据查到的内容回答问题。这解决了幻觉问题,是当时最热门的技术之一。
  • Function Calling(函数调用)
    • 注意:这是 Agent 的前身!在 Agent 流行前,开发者已经学会了让模型识别意图,并输出标准的 JSON 格式来调用 API(比如查天气、查股票)。
    • 区别:当时是“人写代码控制流程,模型负责调用”,而 Agent 是“模型自己决定调用什么、何时调用、调用结果如何”。
  • 代码解释与生成(Code Interpreter)
    • 让模型写 Python 代码,然后在沙箱里运行,以此解决数学计算、绘图或数据处理问题。这其实是 Agent 中“工具使用”能力的雏形。

4. 评估与优化

  • 基准测试(Benchmarks):如 MMLU、GSM8K 等,用于量化评估模型的智力水平。
  • 模型蒸馏(Distillation):用大模型教小模型,让模型在保持性能的同时体积更小,适合端侧部署。

总结:从“被动”到“主动”的跨越

在 Agent 出现之前,大模型更像是一个**“博学的顾问”**:

  • 你问,它答;
  • 你给指令,它执行;
  • 你给工具,它调用。

Agent 带来的本质变化,是将上述技术(特别是 Function Calling + 规划 + 记忆)整合成了一个**“闭环系统”**:

  1. 感知:理解复杂任务。
  2. 规划:自己拆解步骤(以前需要人写代码拆解)。
  3. 行动:自主调用工具、检索信息。
  4. 反思:如果失败了,自己调整策略重试(以前需要人报错重启)。

所以,Agent 并不是凭空出现的新技术,而是大模型能力成熟后,自然进化出的自动化执行形态

http://www.jsqmd.com/news/819016/

相关文章:

  • ARM虚拟化中的精细陷阱机制与HFGRTR_EL2寄存器解析
  • SSD1305 OLED驱动全攻略:从SPI/I2C硬件连接到Arduino/CircuitPython实战
  • AI时代代码复用新范式:动态可执行代码片段管理工具fragments解析
  • 六西格玛只适合大厂?中小厂避坑指南,打破认知误区少走弯路
  • EPLAN原理图绘制避坑指南:从‘中断点’到‘电位定义’,这些符号你用对了吗?
  • Electron 项目选型用 react 还是 vue 框架社区支持度对比
  • 2000-2024年上市公司产学研合作数据
  • 基于Simulink图形化建模求解一阶时变偏微分方程
  • 如何在Java面试中脱颖而出?实用策略大公开
  • 基于LLM与图数据库的智能任务规划引擎:从目标分解到项目执行
  • Cursor编辑器集成演示工具:用Markdown打造专业代码演示
  • 嵌入式数据流解析与LED动画驱动:从协议设计到nRF52840实战
  • KiloCode:命令行代码片段管理工具的设计与实战应用
  • Simulink求解一阶时变偏微分方程:从空间离散化到模型搭建实战
  • 2026Q2乐山临江鳝丝选店指南:临江鳝丝联系方式、乐山临江鳝丝哪家好吃、乐山临江鳝丝哪家正宗、乐山临江鳝丝推荐品牌选择指南 - 优质品牌商家
  • 1.9 掌握Scala抽象类与特质
  • QuPath多通道图像批量复制解决方案:病理图像分析效率提升实战指南
  • ARM系统寄存器ERXADDR与RAS错误处理机制详解
  • SDEP协议解析:嵌入式通信中的总线无关二进制封装方案
  • 偏移重载双缸同步电液伺服控制【附代码】
  • SoloDawn:基于本地优先与纯文本的个人知识管理系统构建指南
  • 同态加密优化与安全字符串匹配技术解析
  • 2026成都泡沫箱厂家排行:成都吸塑包装设计定制/成都吸塑厂/成都吸塑托盘/成都吸塑盒/成都定制泡沫箱/成都泡沫包装盒/选择指南 - 优质品牌商家
  • 四博AI双目智能音箱方案:四路触控、震动马达、0.71/1.28双目光屏、三轴姿态感应,一键语音克隆和专属知识库
  • QMC5883P磁力计实战指南:从I2C驱动到航向解算全解析
  • 基于RP2350B与CircuitPython的复古游戏机开发实战
  • 高精度直流功率监测模块INA23x:硬件解析与嵌入式应用实战
  • 树莓派Pico通过DVI Sock实现HDMI视频输出:原理、配置与图形编程实战
  • 基于AI Agent的邮件自动化处理平台:从架构设计到生产部署实战
  • 2026年Q2渔具标牌标杆名录:超薄镍标牌、金属标牌、金属镍标牌、铝标牌、镍标logo、镍标制作、镍标牌厂家、镍标牌定制选择指南 - 优质品牌商家