当前位置：首页 > news >正文

Claude Opus 4.7 相比 Opus4.6 关键改善总结

news 2026/8/2 13:30:38

Claude Opus 4.7 相比之前的 4.6 版本，最核心的提升集中在视觉分辨率、自主编程能力以及指令遵循的严谨性。以下是关键改善点的详细总结：

1. 视觉能力的质跃 (Vision)

分辨率提升 3 倍：支持最高 2576px / 3.75MP 的图像，而 4.6 仅为 1.15MP。
像素级精度：视觉感知准确率从 54.5% 提升至 98.5%。这使得它能精准处理高密度的 UI 界面、复杂的架构图以及小型文本，极大增强了其在“计算机使用（Computer Use）”场景下的表现。 [1, 2, 3, 4, 5]

2. 编程与自主智能体 (Coding & Agents)

基准测试突破：在 SWE-bench Pro 测试中，解决问题的比例从 53.4% 提升至 64.3%。
长程任务自主性：相比 4.6，其解决生产级代码任务的能力提升了 3 倍，能够更稳定地处理跨文件调试和复杂系统重构，且工具调用错误减少了约 1/3。
自我验证机制：新增了“严谨性”逻辑，会在提交答案前自动进行逻辑校验或代码证明。 [3, 4, 6, 7, 8, 9]

3. 指令遵循与语气优化 (Behavior)

更 literal（字面）的遵循：它比 4.6 更少猜测用户意图，更严格地执行复杂指令。
专业化语气：减少了冗余的礼貌用语（废话）和表情符号（Emoji），语调更直接、更具洞察力，适合企业级文档撰写。
长度自适应：回答长度会根据任务复杂度动态调整，不再默认输出长篇大论。 [10, 11, 12, 13]

4. 新功能与效率

xhigh 努力级别：在 high 和 max 之间新增了 xhigh 模式，平衡了推理深度与生成速度。
任务预算 (Task Budgets)：允许用户为长程任务设置 Token 上限，模型会据此智能分配推理资源。
效率增益：根据 Box 的评估，Opus 4.7 在实际业务流中减少了 56% 的模型调用和 50% 的工具调用，速度提升了约 24%。 [2, 4, 14, 15, 16]

5. 成本与 Tokenizer

价格不变，计费变动：API 价格维持在 $5 / $25，但采用了新版 Tokenizer，相同文本映射的 Token 数量可能增加 10% - 35%。这意味着尽管单价没变，实际运行成本可能会有小幅上升。 [7, 17]

总结表：关键参数对比

特性	Claude Opus 4.6	Claude Opus 4.7
最高分辨率	1568px (1.15MP)	2576px (3.75MP)
视觉感知准确率	54.5%	98.5%
SWE-bench Pro 得分	53.4%	64.3%
推理层级	high / max	high / xhigh / max
核心提升方向	基础推理与对话	自主 Agent、高精视觉、工程验证

您是否需要我为您整理一份 Opus 4.7 在智能锁 App UI 细节识别方面的具体测试建议？

[1] https://www.youtube.com
[2] https://platform.claude.com
[3] https://venturebeat.com
[4] https://medium.com
[5] https://aws.amazon.com
[6] https://venturebeat.com
[7] https://the-decoder.com
[8] https://www.moneycontrol.com
[9] https://thenextweb.com
[10] https://platform.claude.com
[11] https://cloud.google.com
[12] https://www.the-ai-corner.com
[13] https://www.reddit.com
[14] https://code.claude.com
[15] https://9to5mac.com
[16] https://9to5mac.com
[17] https://www.anthropic.com