当前位置: 首页 > news >正文

Anthropic Agent SDK 不同模型前缀缓存的稳定性

以下现象为亲测发现的问题:

claude-opus-4-7 / claude-opus-4-8: 在Agent SDK运行过程中,如果有mcp tool 通过 tool_search方式延迟加载function schema,则在下轮API call时,uage中可以看出前缀缓存完全重写,会决大部分重写(有可能是匹配到其他session写过的缓存)。其他情况缓存命中都还正常。

claude-haiku-4-5: mcp tool没有通过延迟加载,似乎直接进入了system prompt,但前两轮在模型都经过思考的情况下,第二轮却没有命中第一轮创建的全部缓存,而是只命中了一部分。感觉缓存命中不稳定,有漂移,但不知道啥原因。

claude-sonnet-4-6: 目前测下来缓存是稳定命中的,mcp tool 通过 tool_search延迟加载时也没出现缓存失效的情况。

另外,haiku模型的智能水平明显不行,用于做主Agent的话容易做出错误判断,导致撞了很多墙后才能找到正确运行路径。虽然单价便宜,但有可能最终耗费的钱并不少,且因为走错步骤太多导致运行总时长可能反而更长。

claude-opus-4-8 跟 4-7 比起来,感觉成本反而降了些,虽然单价相同,但在同样的轮次都能完成任务的情况下,有可能是思考的tokens更少,所以成本和时间都比opus4.7更省。 甚至这两项也不输sonnet4.6

http://www.jsqmd.com/news/919396/

相关文章:

  • 德伟DCD780电钻开关接触不良故障维修全攻略
  • STM32F4驱动AD7606避坑指南:SPI配置、时序调试与电压换算全流程
  • Gemini测试用例生成能力深度测评(实测137个API接口,缺陷捕获率提升68.3%)
  • 【Gemini用户故事编写黄金法则】:20年资深专家亲授7大避坑指南与实战模板
  • 毕业论文神器!2026最新AI论文写作软件测评与推荐
  • 数据集成平台推荐:2026年企业级数据集成能力与信创适配全景评测 - 科技焦点
  • 深度解析:VRM4U在Unreal Engine 5中的VRM运行时加载技术实现
  • AI驱动智能纪念品设计全流程:从数据训练到量产交付的7步极简工作流(附2024最新工具链清单)
  • VS2013安装后别急着写代码!先完成这5个关键设置(主题、项目模板、安全检查关闭)
  • 数据可视化大屏引擎推荐:2026年大屏设计与实时数据展示能力全景横评 - 科技焦点
  • 超微X10/X11服务器开机卡代码?别慌,手把手教你排查内存、CPU、PCIe三大‘元凶’
  • LuckyLilliaBot:如何快速构建企业级多协议QQ机器人完整实战指南
  • Seraphine:英雄联盟玩家的智能助手,3分钟开启高效游戏体验
  • 企业部署ChatGPT/文心一言/通义千问前必须做的7项版权合规动作:错过第4项=面临千万级赔偿风险
  • 2026最新!AI论文写作工具测评:这几款知网都认可
  • 关于深圳先途邦跨境海外商标注册的专业度探讨 - 广东科技观察
  • 避开部署坑!OpenClaw v2.7.8 完整安装流程整理
  • 数据分析报告生成工具有哪些?2026年主流产品报告自动化与落地能力全解析 - 科技焦点
  • 避开STM32G4比较器的那些坑:LOCK机制、EXTI连接与滞回电压HYST配置详解
  • ArcGIS提取的高程点导到CAD没高度?一个字段赋值的小操作就能解决
  • 别再盲目测序了!用Jellyfish+GenomeScope2.0,5步搞定基因组大小和杂合度预估(附R绘图避坑指南)
  • OpenVLA 技术综述
  • 掌握Markdown实时预览:打造高效写作工作流的3个关键策略
  • ADI DSP老玩家血泪史:ADZS-ICE-1000仿真器最全避坑指南(附驱动安装与CCES 2.11.1配置)
  • 从‘记不住’到‘忘不掉’:Cookie、Session与Token,你的Web登录方案选对了吗?
  • Python视频处理基础
  • 2026年大模型行业转折:从参数竞赛到价值验证,中小企业怎么跟上
  • 【超高质量】eNSP OSPF动态路由完整实操教程(原理详解+多设备组网+深度排错)
  • BI大数据分析平台哪个好:2026年主流平台数据处理与AI分析能力深度横评 - 科技焦点
  • 终极游戏隐身指南:掌控你的在线状态,专注每一场战斗