当前位置：首页 > news >正文

Claude Opus 4.7 深度解析：AI 新旗舰，重新定义边界

news 2026/6/6 18:11:06

2026 年 4 月 16 日，Anthropic 正式发布Claude Opus 4.7——这是该公司旗舰序列 Opus 的最新迭代，距 Opus 4.6 发布仅间隔两个月，延续了每两个月一次的稳定升级节奏。

这一次，Opus 4.7 带来的不只是数字上的跳跃。在软件工程能力、视觉理解精度、长周期自主执行三个维度，它均实现了质的飞跃——让 AI 处理真实世界复杂任务的可能性，又向前推进了一大步。

"用户现在可以放心地将此前需要严密人工监督的最复杂编码任务交给 Opus 4.7，无需全程盯梢。"
— Anthropic 官方发布说明

指标	Opus 4.7	Opus 4.6	提升幅度
生产任务解决量（Rakuten-SWE-Bench）	—	—	3×
CursorBench 编程基准	70%	58%	+12pp
XBOW 视觉敏锐度	98.5%	54.5%	+44pp
Finance Agent 评估	0.813	0.767	+6%
93项编码基准解决率	—	—	+13%
图像最大分辨率（长边）	2576px	~860px	3×

软件工程是 Opus 4.7 最耀眼的升级方向。在 Anthropic 官方评估以及第三方实测中，它的编程能力远超 GPT-5.4 和 Gemini 3.1 Pro，逼近当前最强的 Claude Mythos Preview。

Opus 4.7 从零开始，自主构建了一套完整的Rust 文本转语音引擎，包括：

这相当于高级工程师数月的工作量，全程无需人工干预。

✅关键特性：规划阶段自我捕获错误
Opus 4.7 在开始执行前会主动检查逻辑错误，而非执行到一半才发现问题——大幅降低了长链路任务的失败率。

视觉理解是本次升级中最具戏剧性的一项。XBOW 视觉基准测试得分从54.5% 骤升至 98.5%，几乎是翻倍。

XBOW 视觉基准对比 Opus 4.7 ████████████████████████████████████████ 98.5% Opus 4.6 ██████████████████████░░░░░░░░░░░░░░░░░░ 54.5%

⚠️注意：高分辨率图像会消耗更多 Token。如果不需要额外细节，建议提前对图像进行降采样以控制成本。

Opus 4.7 最核心的目标之一，是让 AI 能够在数小时内独立、连贯地完成复杂任务。

新增介于high和max之间的xhigh等级，让开发者在推理深度与延迟之间拥有更精细的调节空间。

开发者可以通过 API 引导 Token 支出，在长时间运行的代理任务中优先分配计算资源，有效控制成本。

Claude Code 新增斜杠命令，启动专属审查会话：

此前仅限特定用户的 Auto 模式（Claude 自主决策、减少中断）现已对所有Max 订阅用户开放。

评测基准	Opus 4.7	Opus 4.6	行业领先
Finance Agent 评估	0.813	0.767	✅ 是
GDPval-AA（金融/法律综合）	业界领先	—	✅ 是
Harvey BigLaw Bench（法律）	90.9%	—	✅ 是
CursorBench（编程）	70%	58%	✅ 是
XBOW 视觉敏锐度	98.5%	54.5%	✅ 是