当前位置：首页 > news >正文

“无主权路由”的奇袭：Sakana AI 如何在地缘政治夹缝中完成技术突围？

news 2026/6/24 8:53:28

引言：以小博大的“河豚”突围

买不起昂贵算力、拿不到顶尖大模型授权的开发者，还有机会在技术上突围吗？日本东京的 AI 新星Sakana AI刚刚用实际行动给出了答案：他们正式发布了商业化多智能体路由系统Fugu（河豚）及其超强版Fugu Ultra。

在一系列业界公认最严苛的基准测试中，Fugu Ultra 拿下了令人侧目的成绩。尤其是在软件工程基准测试SWE-bench Pro上，Fugu Ultra 斩获了73.7的高分，不仅甩开了 GPT-5.5，更是击败了目前被美国政府列为严密管制、对部分国家与地区实施技术封锁的顶尖大模型Claude Fable 5。

这个结果在技术社区和地缘政治学者中引起了截然不同的反应。此前低调的 Sakana AI，究竟如何靠一个 7B 的小模型担任“指挥官”，击败了千亿级以上的行业巨无霸？这背后既有以小博大的精妙算法设计，也透露出非美中核心地缘圈内的第三方团队，在算力限制下的生存智慧。

技术揭秘：Fugu 如何通过系统级协调以小博大

为什么起名叫Fugu（河豚）？

在日语中，河豚味道极其鲜美，但若处理不当，其剧毒足以致命。Sakana AI 认为，在当前的 AI 演进中，“多智能体系统（Multi-Agent System）”就如同河豚——如果缺乏有效的调度和控制，多个模型协作会带来极高的调用延迟、逻辑混乱与开发开销（剧毒）；但如果能完美协调，就能爆发出远超单体大模型的群体智慧（美味）。

Fugu 的技术内核并不是重新训练一个更庞大的单体大模型，而是源自 Sakana 被ICLR 2026接收的两篇核心学术论文：

TRINITY：通过进化算法培育的微型大脑

TRINITY 采用了一个仅约 0.6B 参数的超轻量协调模型，外加不足 2 万参数的路由头，依靠进化算法完成训练。面对复杂多轮任务时，TRINITY 会将外部模型池（Agent Pool）中的大模型动态划分为三种协作角色：

思考者 (Thinker)：负责宏观规划，拆解任务步骤。
执行者 (Worker)：负责具体的代码编写、数学推导或逻辑运行。
校验者 (Verifier)：负责对执行者的输出进行严密评估和纠错。

Conductor：用强化学习自我迭代的智能体编排

Conductor 则是一个 7B 参数的模型，它通过强化学习（RL）学会了如何使用自然语言去命令和编排其他模型。它能够根据任务的难易度自适应地拉起协作链条：遇到简单任务直接单发，遇到复杂工程则拉起一个多深度的“规划-执行-校验-修正”工作流，甚至能递归调用自身实现测试时算力的扩展。

如架构图 [fugu-architecture.png](file:///Users/linwang/src/github/xiluo/skills/blogger/articles/sakana-fugu-geopolitics/fugu-architecture.png) 所示，底层复杂的智能体网络对用户是透明的。Fugu Conductor 作为统一的入口，分析用户需求后，调度 Thinker 规划执行步骤，Worker 编写代码或输出结果，最后由 Verifier 进行质量控制。这种类似于多进程协作的管道流，让它能够在不改变底层大模型参数的情况下，输出超越 Claude Fable 5 单体极限的工程能力。

地缘政治：被资源限制逼出来的“无主权路由”

地缘政治和资源限制，在很大程度上塑造了 Sakana AI 的技术路线。

创始人 David Ha 与 Llion Jones（Transformer 奠基论文《Attention Is All You Need》的作者之一）虽然拥有顶尖学术背景，但日本缺乏像 OpenAI 那样动辄数万张 H100 的算力集群，也无法调动美中两国万亿级别的资金规模。

在无法参与昂贵的算力消耗战的背景下，Sakana 避开了直接训练超大模型，转而发力两种更灵巧的算法路线：

进化合并（Evolutionary Model Merging）：利用进化算法在无需反向传播训练的情况下，自动将多个开源模型的权重融合为新模型，类似于基因交叉。
无主权路由（Sovereign-Free Routing）：即 Fugu 的核心架构。它将全球可用的云端模型与本地开源模型视作动态可插拔的算力池，规避对单一闭源 API 的强依赖。

如拓扑图 [geopolitical-bypass.png](file:///Users/linwang/src/github/xiluo/skills/blogger/articles/sakana-fugu-geopolitics/geopolitical-bypass.png) 所示，传统架构极易受到供应链波动的冲击。如果美国对特定区域禁运顶尖模型（如 Claude Fable 5），依赖该 API 的应用将瞬间瘫痪。

Fugu 的智能编排机制提供了一种技术避险手段：

动态容灾与降级：如果某个闭源模型节点被封锁或延迟过高，Conductor 能够实时重定向请求，将复杂任务拆解后分发至日本本土的开源模型集群，或者其他未受限制的云端节点。
开源模型组合拳：利用多智能体在内部的逻辑循环与自校错，用若干个性能稍逊的二线开源模型，组合出接近或匹敌一线闭源模型的推理深度。

这种设计打破了以往“只有掌握千亿参数模型才能解决复杂工程问题”的迷思。美中两国的战略分析者或许会意识到：