当前位置：首页 > news >正文

超越上下文窗口：CodeAct与RLM，两种代码驱动的LLM扩展方案

news 2026/3/26 17:40:40

用语言模型写代码、查数据库、跑自动化流程这些事情大家早就习以为常了。Vibe Coding 到今年二月刚好满一年，绝大多数人或多或少都在用它搞定代码库、写文档、处理各种杂活。但有一个问题始终是避免不了的：任务一多Agent 就开始丢三落四甚至开始一本正经地胡说八道。

MCP 让外部工具的接入变得很方便，Playwright、Supabase、Slack 这些都能挂上去，但代价是Context Rot [1]。简单说就是输入 Token 一多模型性能就会塌方式下降。

我们先看看上下文窗口里到底装了些什么。

Claude的内存结构拆解

拿 Claude 举例，它的上下文窗口大致是这么分配的：系统提示词占 1.4%系统工具（包括 MCP 工具）占 8.3%，Agent 上下文（技能、工具描述、对话历史）吃掉约 70%，用户实际能用的提示词空间反而很小。

Anthropic 的研究数据表示：真正用来放系统级指令的部分只有大约 10%，剩下全被对话历史、工具输出和各种中间结果给填满了。一旦膨胀到 200K Token 的量级模型根本分不清什么才是重点。

https://avoid.overfit.cn/post/021ca9c0ed414fac82ab09532992b7df

http://www.jsqmd.com/news/387869/

相关文章：

Python File 方法详解

写论文如何避免“AI味“？从源头减少AI痕迹的8个技巧

AIGC检测算法到底怎么识别AI文本的？搞懂原理才能有效降AI

五、Claude Opus 4.6 三体银河纪元 -3

降AI的10个常见误区，踩一个就白费功夫（2026年避坑指南）

Cursor、Windsurf、Trae生成的代码报告怎么降AI？程序员写文档也要过AIGC检测了

降AI工具安全吗？会不会泄露我的论文？安全性对比评测

AIGC检测卫士检测结果准不准？对比知网维普差多少

JSP HTTP 状态码详解

Debian Docker 安装指南

豆包降AI完整教程：从生成到降AI一条龙搞定

TCC vs Saga：分布式事务架构选型实战指南

Bootstrap 多媒体对象

《LeetCode 顺序刷题》11 -20

Gemini Vibe Coding运维之Jenkins Pipeline闭环探索

2025趋势：提示工程如何重塑环境监测？架构师详解LLM提示优化的3大落地场景

企业如何通过AI获客？2026年特色GEO服务商盘点 - 品牌2025

从M3U8到MP4 一步步拆解Naver视频流，并用Python实现一个下载器核心

破局！AI应用架构师助力家居场景AI识别器的关键策略

AI原生应用领域：AI工作流的实战应用案例

数据复制延迟问题分析与解决方案

开发AI Agent的情感计算在社交媒体分析中的应用

移动开发：使用 RxJava 实现响应式 UI

【2024美赛C题】O奖论文翻译 2401298 一个双时间贝叶斯网络模型深度解析：原理、实战与踩坑记录

前端解码深入Naver视频流，并实现一个浏览器内的HLS解析下载器

2026年2月GEO优化服务哪家好？中国六大服务商综合实力与技术保障权威排行榜 - 资讯焦点

【Android GLSurfaceView源码学习】第三天：GLSurfaceView的Surface、GLES与EGLSurface的关联 - 详解

Naver视频流解析与本地化获取从HLS协议到跨平台下载器的技术实现