当前位置: 首页 > news >正文

大模型Agent-应用小记【转载】

参考资料

  • 万字长文解读LLM Agent:总体框架、经典论文与实践
  • 万字长文解析Agent框架中的上下文管理策略
  • 从Claude Code入手看Agent框架设计思路(基础篇)

Agent基础

  • Agent基本定义
    • LLM+工具调用 / 长期记忆能力 / 规划能力

上下文管理

  • 是什么?
  • 上下文工程
    • 上下文卸载与检索(Context Offload & Retrieval):将信息转移到文件系统中
      • 将上下文卸载到文件系统(紧凑化, Compaction)
        • 信息可逆压缩,信息并未真正丢失——它们只是被卸载到文件系统中了,随时可以重新加载进来
      • 推理前检索 vs. "Just-in-time"检索
        • 灵活性:搜索的内容可以根据当前需求动态调整,不受预索引的限制。RAG 索引需要定期更新,而直接搜索始终反映最新状态
        • 渐进式寻找:例如在debug的时候,Agent 可以像人类一样,先 grep 查找函数定义,再搜索调用这个函数的位置,然后打开某个文件查看上下文——每一步都基于前一步的结果
    • 上下文摘要(Context Summarization)
      • 信息有损,所以需要将原始完整内容持续化保持到文件中
    • 上下文隔离(多智能体架构)
      • 节省主Agent的上下文
      • 权限控制
      • 特定领域专业化
      • 节约调用成本
    • 上下文缓存
      • KV Cache能复用相同prefix的结果。例如在多轮对话中,前几轮的历史内容可以作为prefix被缓存,后续请求只需处理新追加的内容。这样,即使上下文很长,TTFT(Time to First Token,首字延迟)仍能保持很低
  • 常见QA
    • Q:什么时候使用紧凑化?摘要化?
      • A:应当优先采用可逆的紧凑化策略(如将大文件输出写入磁盘,只保留路径)。但当已经无法再紧凑化,而且上下文也确实即将耗尽时,再使用带备份的摘要化——完整dump聊天记录,然后再摘要,这样就可以让有损的压缩变得可恢复(这两种手段结合起来,Agent 理论上就能够处理无限长的任务,而无需无限大的上下文窗口,同时保留了关键信息)

上下文工程



http://www.jsqmd.com/news/588713/

相关文章:

  • 植物大战僵尸版本所有版本合集下载含杂交版 融合版 火影版 二战版 无双版 抽卡版 β版等等
  • 启动Comsol本地服务
  • 特定域名的proxy访问
  • WarcraftHelper:魔兽争霸III终极优化指南 - 解决宽屏、帧率、地图限制三大痛点
  • 【完整源码+数据集+部署教程】人脸遮挡检测系统源码分享[一条龙教学YOLOV8标注好的数据集一键训练_70+全套改进创新点发刊_Web前端展示]
  • PVE虚拟环境下Ubuntu24.04.3虚拟机安装OpenClaw
  • 2026 AI简历工具排行榜:写出专业简历,助你直通面试
  • MongoDB单节点转副本集(Docker安装版本)
  • 国内支持全网手机/座机/400/95/96号码认证的服务商清单 - 企业服务推荐
  • 9.3LED点阵屏显示动画
  • 全域数学理论宇宙本源正式宣言(乖乖数学)
  • 3步高效获取电子课本:tchMaterial-parser让国家中小学智慧教育平台资源轻松到手
  • YOLO系列算法改进 | C3k2改进篇 | 融合SACF光谱引导自适应跨层融合 | 光谱聚合与空间细节协同增强,跨层融合信息零损失,适用于多光谱遥感检测与边缘部署场景 | AAAI 2026
  • 【完整源码+数据集+部署教程】喷嘴检测系统源码分享[一条龙教学YOLOV8标注好的数据集一键训练_70+全套改进创新点发刊_Web前端展示]
  • 大模型指令微调入门基础教程(非常详细),从通才到专才全景解剖,收藏这一篇就够了!
  • 2026洛氏硬度计品牌深度盘点:金属材料行业洛氏硬度计企业推荐 - 品牌推荐大师
  • 北美推动视频车联网市场到2030年达到2200万台
  • 英特尔斥资142亿美元回购爱尔兰Fab 34晶圆厂股权
  • 深度拆解 Linux Ext 系列文件系统:从硬件底层到软硬链接全流程
  • 100天精通Android Kotlin:50个实战项目构建你的全栈技能图谱
  • 【手把手详细教程】 Trae AI和Vscode~使用第三方中转API配置Claude ,GPT,Gemini等大模型教程
  • 根据所给文字范围,为您提供的总结标题为:“使用栅格法结合蚁群算法规划机器人全局路径
  • 跨境电商多平台管理 2 小时上手
  • 黑马头条日记 | 分布式任务调度平台XXL-JOB —— XXL之力一举完成热点文章定时计算
  • BaiduPCS-Web技术解密:构建高效百度网盘加速工具的前后端架构深度剖析
  • 一篇吃透RNN(循环神经网络),LSTM(长短期记忆网络),BiLSTM(双向长短期记忆网络)算法,计算机小白也能轻松看懂
  • LangChain4j聊天记忆存储选型指南:除了MongoDB,向量库、Redis、S3怎么选?
  • CTF杂项Misc零基础通关攻略!隐写\+编码\+流量分析,新手最快拿分题型
  • 长程Agent入门基础教程(非常详细),搞懂埃森哲MemexRL“建索引”,收藏这一篇就够了!
  • 遗传算法VRP问题:VRP,多车容量约束 针对物流问题,根据实际情况,设置多车多容量,采用遗传...