AGI编码争霸:Claude Opus 4.8登顶,GPT - 5.6本周或发布,谁能笑到最后?
AGI编码领域争霸激烈
在AGI编码领域,OpenAI和Anthropic为争夺代码领域霸主地位竞争激烈。AGI Ranker最新Coding排行榜上,Claude Opus 4.8以81.01分坐上王座,GPT - 5.5的77.48分被踩在脚下,差距3.5分。
编程王座三月内三易主
三个月内,编程王座几经易主。第一次,Claude Opus 4.7登顶,Anthropic弹冠相庆;第二次,GPT - 5.5反超,OpenAI扳回一城;第三次,Opus 4.8以81.01分杀回,Anthropic重新站上榜首。
各方动态不断
据悉,Anthropic虽已秘密提交IPO申请,但先天算力不足,而OpenAI和谷歌DeepMind未尝不能再次赶上。刚刚,OpenAI发布今晚直播预告,奥特曼或现身。明天,OpenAI将于美国东部时间上午举行「Intelligence at Work」直播活动,奥特曼将出席。随后,纳德拉将于美国东部时间下午发表Microsoft Build大会的开幕主题演讲。微软预计也将在明天发布其自研的新模型。Anthropic表示将很快推出Mythos级别的模型。
OpenAI重大动作
Polymarket预测GPT - 5.6将在6月8日至14日之间发布的概率为68%。这周对OpenAI来说至关重要。OpenAI将于明天发布一次重大的Codex更新,据OpenAI内部透露,Codex团队为这次更新开发了数月,核心方向是让Codex从「代码补全工具」进化成「编程智能体」。昨日,OpenAI确认,Codex及前沿模型现已在AWS Bedrock上全面可用,并将其描述为「更广泛扩展的开端」。同时,奥特曼还在宣传OpenAI基金会关于社会韧性的相关工作。
GPT - 5.6爆料不断
内部人士称GPT - 5.6本周即将发布,性能有望直逼Anthropic Mythos顶级水准,却只需2 - 3倍更低价格。同步Codex重大升级,推理、前端生成、个性与智能体工作流全面进化,效率优化让长流程Agent真正落地,这可能是2026年最重磅AI发布。不过,关于GPT - 5.6的讨论并非凭空捏造,但与正式发布之间还差好几步。Polymarket上交易员认为在2026年6月30日前公开发布的概率约为80 - 89%,这只是一个概率,不是OpenAI的承诺。看发布节奏规律,OpenAI快速连续发布了GPT - 5.4、GPT - 5.5、GPT - 5.5 Instant,延续这一节奏再发布一个小版本更新是合理推测。据网友透露,OpenAI胸有成竹,GPT - 5.6并非应对性发布,其在某些方面的目标是比GPT - 5.5提升12%到15%,相比Opus 4.7到4.8之间约6.5%的平均提升幅度,这一步幅巨大。
Anthropic的困境
Anthropic的处境很微妙。Opus 4.8登顶Coding榜,Mythos在网安领域碾压对手,Claude Code在开发者社区的口碑持续走高,模型能力目前不虚任何人。但Anthropic的算力来源高度依赖亚马逊和谷歌的云基础设施,没有OpenAI背后的微软Azure那种级别的独占算力协议,也没有谷歌DeepMind那种和硬件团队同在一个屋檐下的垂直整合优势。IPO是Anthropic补上这块短板的关键一步,但钱什么时候到、到多少、够不够在算力军备竞赛中跟上节奏,都是未知数。Mythos的定价策略也暴露了矛盾,6倍于Opus的Token价格,说明Anthropic在用高定价来覆盖高推理成本,这在短期内可以靠能力领先撑住,但一旦竞品用更低的价格做到接近的能力,高价策略就变成了高价包袱。
AGI竞赛新态势
代码能力排行榜的王座以周为单位易手,这在AI历史上从未发生过。过去的技术竞赛,领先者的优势以年计,如搜索引擎领域谷歌领先了二十年,移动操作系统iOS和安卓的格局十几年没有本质变化。但在AGI竞赛的最前沿,两家公司的差距已经压缩到了3.5分,一个季度内三次易手。这意味着决定胜负的不再是模型本身,当模型能力趋近时,算力、资本、生态、速度、定价策略、甚至IPO时机,每一个非技术因素都在成为胜负手。Anthropic有最强的模型,但需要IPO来补算力;OpenAI有最深的口袋,但需要GPT - 5.6来夺回王座;谷歌有最大的基础设施,但Gemini的Coding分数正在被拉开。人类历史上第一次,两家公司以周为单位争夺「最接近通用智能」的桂冠。今晚OpenAI亮剑之后,排行榜上的数字会不会再变一次?81.01分的王座,还能坐多久?
