当前位置: 首页 > news >正文

超越上下文窗口:CodeAct与RLM,两种代码驱动的LLM扩展方案

用语言模型写代码、查数据库、跑自动化流程这些事情大家早就习以为常了。Vibe Coding 到今年二月刚好满一年,绝大多数人或多或少都在用它搞定代码库、写文档、处理各种杂活。但有一个问题始终是避免不了的:任务一多Agent 就开始丢三落四甚至开始一本正经地胡说八道。

MCP 让外部工具的接入变得很方便,Playwright、Supabase、Slack 这些都能挂上去,但代价是Context Rot [1]。简单说就是输入 Token 一多模型性能就会塌方式下降。

我们先看看上下文窗口里到底装了些什么。

Claude的内存结构拆解

拿 Claude 举例,它的上下文窗口大致是这么分配的:系统提示词占 1.4%系统工具(包括 MCP 工具)占 8.3%,Agent 上下文(技能、工具描述、对话历史)吃掉约 70%,用户实际能用的提示词空间反而很小。

Anthropic 的研究数据表示:真正用来放系统级指令的部分只有大约 10%,剩下全被对话历史、工具输出和各种中间结果给填满了。一旦膨胀到 200K Token 的量级模型根本分不清什么才是重点。

 

https://avoid.overfit.cn/post/021ca9c0ed414fac82ab09532992b7df

http://www.jsqmd.com/news/387869/

相关文章:

  • Python File 方法详解
  • 写论文如何避免“AI味“?从源头减少AI痕迹的8个技巧
  • AIGC检测算法到底怎么识别AI文本的?搞懂原理才能有效降AI
  • 五、Claude Opus 4.6 三体银河纪元 -3
  • CSS3 按钮
  • 降AI的10个常见误区,踩一个就白费功夫(2026年避坑指南)
  • Cursor、Windsurf、Trae生成的代码报告怎么降AI?程序员写文档也要过AIGC检测了
  • 降AI工具安全吗?会不会泄露我的论文?安全性对比评测
  • AIGC检测卫士检测结果准不准?对比知网维普差多少
  • JSP HTTP 状态码详解
  • Debian Docker 安装指南
  • 豆包降AI完整教程:从生成到降AI一条龙搞定
  • TCC vs Saga:分布式事务架构选型实战指南
  • Bootstrap 多媒体对象
  • 《LeetCode 顺序刷题》11 -20
  • Gemini Vibe Coding运维之Jenkins Pipeline闭环探索
  • 2/16
  • 2025趋势:提示工程如何重塑环境监测?架构师详解LLM提示优化的3大落地场景
  • 企业如何通过AI获客?2026年特色GEO服务商盘点 - 品牌2025
  • 从M3U8到MP4 一步步拆解Naver视频流,并用Python实现一个下载器核心
  • 破局!AI应用架构师助力家居场景AI识别器的关键策略
  • AI原生应用领域:AI工作流的实战应用案例
  • 数据复制延迟问题分析与解决方案
  • 开发AI Agent的情感计算在社交媒体分析中的应用
  • 移动开发:使用 RxJava 实现响应式 UI
  • 【2024美赛C题】O奖论文翻译 2401298 一个双时间贝叶斯网络模型深度解析:原理、实战与踩坑记录
  • 前端解码 深入Naver视频流,并实现一个浏览器内的HLS解析下载器
  • 2026年2月GEO优化服务哪家好?中国六大服务商综合实力与技术保障权威排行榜 - 资讯焦点
  • 【Android GLSurfaceView源码学习】第三天:GLSurfaceView的Surface、GLES与EGLSurface的关联 - 详解
  • Naver视频流解析与本地化获取 从HLS协议到跨平台下载器的技术实现