当前位置: 首页 > news >正文

Claude上下文再大,也绕不开agent开发的“分治”艺术

你是否经历过这样的场景?

为了让AI理解一份百页合同,你将PDF分割成十几段,逐段上传。第一段问签约方,第二段问金额,到了第八段想问违约责任与前面条款的关联时,AI已经忘了第三段提到的违约金比例。你不得不回头,把相关段落再贴一遍,重新提问。

你心想:要是上下文窗口再大一点,就好了。

最近Anthropic将Claude的上下文窗口扩展至100万token。人们在欢呼:分块处理的时代结束了,我们终于可以把整个文档、整个代码库、整个谈判历史一次性丢给AI。

但真的是这样吗?

Anthropic在博客中写下一句容易被忽略的话:“一百万token的上下文,只有在模型能够回忆正确的细节并在此基础上进行推理时才重要。Opus在MRCR v2上得分为78.3%,是该上下文长度下前沿模型中的最高分。”

这句话揭示了一个反事实的真相:大窗口本身不是终点,有效推理才是。而当我们冷静下来审视时会发现——由于上下文永远无法装下客观事实的全部,分治处理这一古老智慧非但不会消亡,反而需要在新的技术背景下被重新理解和精细化

如果我们可以合理地分配、切割场景、定义压缩规则、设计跨源查询逻辑,那么在很多任务中,我们可能根本不需要100万token的上下文。


问题的本质:当分治不可避免,我们的得失是什么

在拥有百万上下文窗口之前,人们不得不把长内容切碎处理。这带来三重损失:

  1. 压缩损失——为了把内容塞进有限窗口,必须压缩,压缩意味着细节丢失。
  2. 交叉比对损失——当内容被切成M块和N块,问题就变成了一个M×N的配对问题。每一次跨块查询都需要额外的上下文切换,而切换意味着遗忘。
  3. Token的重复计费——一篇文章一次给AI,系统提示词消耗一次;分成M次给,消耗M次。冗余输入和冗余输出都是成本的大头。

百万token窗口的诱人之处,在于它让我们看到了一

http://www.jsqmd.com/news/485354/

相关文章:

  • 为什么说杨建允团队是GEO优化的顶级服务商? - 博客万
  • 理性评估:对比主流AI证书,赛一认证对应届生求职的实际加成
  • windows10本地安全隔离配置openclaw
  • 国产化控件如何实现KindEditor的PDF自动格式转换?
  • 解锁论文写作新姿势:书匠策AI,你的期刊论文智能导航员
  • 2026年佛山推荐售后好的木纹砖生产厂,哪家更值得选全揭秘 - 工业品网
  • 【爬虫】使用 Scrapy 框架爬取豆瓣电影 Top 250 数据的完整教程
  • 海洋主题文本聚类研究与可视化分析
  • 2026年上海靠谱中央空调排名,实力强的厂家推荐 - mypinpai
  • 为什么积分运算电路在反馈电容上要并联电阻
  • 教程分享:Vue2如何结合百度WebUploader插件实现大文件上传的进度可视化?
  • 航空航天Web服务如何基于百度WebUploader实现三维模型文件的跨平台分块校验?
  • 分布式驱动电动汽车模型:前轮主动转向与直接横摆力矩联合控制开发之路
  • 2026年佛山靠谱的GEO优化公司排名,知名GEO优化企业大盘点 - 工业推荐榜
  • 电动汽车集群并网的分布式鲁棒优化调度 电动汽车集群优化 采用matlab+yalmip编程,设...
  • 政务CMS如何扩展KindEditor的多格式文档智能填充?
  • CAIE认证课程体系全景图:从基础到进阶,覆盖哪些核心技术?
  • 通信工程毕业设计最新题目汇总
  • 农业信息化如何优化KindEditor的Web截屏插件功能?
  • C++编程实践—C++处理磁盘大小
  • 微信小程序 舞蹈课程预约系统 舞房约课系统
  • 2026年专科生必看!千笔·降AI率助手,最受欢迎的降AI率网站
  • 生成引擎优化(GEO)提升数字内容创作效率与用户体验的实践指南
  • 2026深度测评10款论文降重工具:3个免费方法亲测有效!谁是降重的最优解?(附论文降重避坑指南)
  • LangChain 实战:大模型对话记忆模块(附完整代码 + Web 案例)
  • 【黎阳之光:以无线专网与视频孪生,赋能智慧广电与数字中国】
  • Hello Vibe:面向小白/入门级开发者的AI编程指南
  • 虚拟机创建
  • 大厂量产的两相交错TCM图腾柱变频控制PFC+全桥LLC源代码 PFC可通过变频控制实现软开关
  • 建议收藏|一键生成论文工具,千笔写作工具 VS Checkjie,多场景适配首选