当前位置: 首页 > news >正文

2026 年东京 Sakana AI 发布 Fugu:多模型协作或成 AI 新前沿,挑战单一模型霸权

发布信息

2026 年 6 月 22 日,东京 AI 公司 Sakana AI 正式发布了 Fugu——“用一个模型指挥所有模型”的多 Agent 编排系统。Fugu 的核心赌注是 AI 能力的下一步提升来自让多个已有模型协同工作,而非造出更大的单一模型。

公司背景

2023 年 7 月在东京成立,三位联合创始人各代表稀缺能力维度。CEO David Ha 是前 Google Brain 研究科学家,曾领导 Stability AI 研究团队;CTO Llion Jones 是《Attention Is All You Need》合著者之一,Transformer 架构出自该研究小组;COO Ren Ito 曾任职于日本外务省,为公司提供政府关系和地缘政治判断力。

公司在 2024 年 9 月完成约 2 亿美元 A 轮融资后成日本估值最高 AI 独角兽,2025 年 11 月以约 26 亿美元估值完成 1.35 亿美元 B 轮融资,投资者包括 Khosla Ventures、Lux Capital、NEA、NVIDIA、三菱 UFJ 金融集团和三井住友银行。核心研究路线是“从自然界获取灵感的可持续 AI”。

技术原理

将两篇 ICLR 2026 论文——TRINITY 和 Conductor 的研究成果打包成 OpenAI 兼容 API 端点。Fugu 内部,轻量级协调器动态挑选 Thinking、Working、Verifying 三种角色的 Agent,拆分、委托、验证、整合任务并返回结果,过程对用户不可见、不可配置。

Fugu 架构是学习出来的协调系统,TRINITY 论文贡献轻量级协调器,Conductor 论文通过强化学习让协调器发现 Agent 通信模式和提示策略,使 LLM 池集体表现超个体模型。协调策略是机器摸索出的最优协作模式,因此 Sakana AI 不公开具体模型列表和路由策略。

产品变体

Fugu 分为两个变体。Fugu 在性能和延迟间取平衡,面向日常编码、分析和聊天场景;Fugu Ultra 使用更深更大 Agent 池,固定参与模型不可剔除,目标是提升答案质量,调用时内部并行触发多次推理、验证、合成,耗时和 Token 消耗高于 Fugu。

定价策略

Fugu Ultra 多个 Agent 同时工作时,计费基于最高一档费率,“不叠加计费”策略降低开发者对多 Agent 系统隐性成本的恐惧。

测试数据

Fugu Ultra 在多个基准测试中表现出色。在 SWE Bench Pro 上,得分 73.7 超越 Opus 4.8 的 69.2 和 GPT - 5.5 的 58.6,仅次于 Anthropic 的 Fable 5 和 Mythos Preview;在 TerminalBench 2.1 上得分 82.1 超过 Fable 5;在 LiveCodeBench Pro 上得分 90.8,在 GPQA - D 上拿到 95.5,在 Humanity's Last Exam 上以 50.0 与 Fable 5 持平。且未使用 Anthropic 最新模型,证明多模型系统不包含最强单一模型也能追平或超越。

定性展示

六个演示案例中,Fugu Ultra 在 BPB 优化任务上降低损失,盲棋对弈击败前沿模型和 Stockfish 引擎,CAD 机械光圈设计产出可用曲柄连杆机构,交易模拟实现 19.43% 累计收益,优于对比模型。这些任务多步骤、需多轮验证,单模型易出错。

用户口碑

早期用户反馈良好。软件工程师称 Fugu Ultra 代码审查比 GPT - 5.5 好;平台架构负责人强调 Fugu 长会话“人设稳定性”出色;安全工程师用 Fugu 完成完整安全评估流程;研究人员报告 Fugu 自主运行近四小时,几乎无需人类干预。

地缘政治意义

Fugu 发布时机有地缘政治意味,Sakana AI 提及 Anthropic 模型出口管制事件,认为单供应商依赖是脆弱性。Fugu 的 Agent 池可替换,能动态绕过受限模型,Sakana AI 称其为“AI 主权”,在亚太市场有受众。美国 AI 公司出口限制为日本、韩国和欧洲替代方案创造市场空间。

定价结构

Fugu 定价结构分两轨。订阅轨面向个人和团队,Standard 每月 20 美元,Pro 100 美元,Max 200 美元,均可同时使用 Fugu 和 Fugu Ultra。企业按量付费轨中,Fugu 按底层模型公开费率计费,Fugu Ultra 输入价格每百万 Token 5 美元(上下文超 272K 时翻倍),输出价格每百万 Token 30 美元(超长上下文时 45 美元),缓存输入 0.50 美元。六月订阅可获第二个月免费,企业 Token 优先级高于订阅用户。目前 Fugu 在欧盟和欧洲经济区不可用,公司正推进 GDPR 合规工作。

产业意义

Fugu 代表 AI 产业发展方向转折信号。2023 - 2025 年行业认为“更大的模型 = 更好的结果”,2026 年上半年事件推动新共识形成:下一个前沿是让现有模型更聪明协作。Fugu 是新共识下首个封装为标准化 API 产品,能否持续超越编排模型最佳者需更多验证,但已将学术概念变为可调用服务。开发者是否愿为“黑箱协调器”支付溢价,答案将在后续使用数据中浮现。

http://www.jsqmd.com/news/1063859/

相关文章:

  • 九江渗漏维修靠谱机构盘点 2026、全屋防水堵漏正规企业实力排名一览 - 宅安选房屋修缮
  • OpenCore Legacy Patcher完整教程:四步解决老Mac显卡兼容性与系统升级问题
  • 2026年西安靠谱装修公司盘点 覆盖新房整装、老房翻新与别墅全案 - 信息热点
  • 人脉圈广的优质EMBA项目2026理性测评指南 - 品牌2026推荐
  • 【Springboot毕设全套源码+文档】基于Java+springboot图书销售系统(丰富项目+远程调试+讲解+定制)
  • 襄阳渗漏维修靠谱机构盘点 2026、全屋防水堵漏正规企业实力排名一览 - 宅安选房屋修缮
  • 2026Q3成都流水线厂家推荐成都输送设备流水线公司、成都自动化生产线厂家权威榜单盘点深度测评 - 品牌优企推荐
  • 2026年6月江诗丹顿官方售后服务热线与全维度线下网点地址售后服务体系详解 - 资讯快报
  • 2026年三亚海棠湾回收名酒靠谱商家推荐:全维度实力解析 - 资讯快报
  • 靠谱的无锡专利机构 选择核心标准看这几点 - 资讯快报
  • ATECC608C安全芯片命令体系详解:从ECC签名到AES加密的物联网安全实践
  • IDM激活脚本完全指南:3分钟永久解锁高速下载神器
  • 新疆出行实用参考:游玩时长规划与多位本地持证领队真实体验整理 - 信息热点
  • 连云港渗漏维修靠谱机构盘点 2026、全屋防水堵漏正规企业实力排名一览 - 宅安选房屋修缮
  • HoRain云--Flutter布局核心:从心智到实战
  • BilibiliDown:如何从B站视频中提取高品质音频的完整指南
  • 季米家纺(JONRMEC)四件套床上用品全系列介绍:九大系列、面料体系与全品类能力一篇看懂 - qiqi1113
  • 六安裕安区土菜测评榜|本地人私藏正宗皖西土菜馆推荐 - 信息热点
  • 2026苏州园区家装全屋防水维修案例|本地直营上门服务,一站式根治家装渗漏难题 - 徽顺虹
  • Vue 大屏里的 Swiper、轮询和滚动定时器:如何治理资源生命周期
  • 智能体驱动的可视化分析框架:从数据到洞察的自动化协同
  • DepotDownloader终极指南:高效下载Steam游戏资源的完整实战教程
  • 2026点云处理软件怎么选?全维度解析 - 资讯快报
  • 如何在5分钟内免费安装VideoDownloadHelper:浏览器视频下载终极指南
  • 智能跨平台输入共享实战指南:3步实现无缝多设备控制方案
  • Ubuntu 18.04 Jenkins 安装实战:绕过官方源与Docker陷阱
  • 2026年 东莞木板厂家推荐排行榜:实木/多层实木/ENF级/防火防虫抗蚁/免漆香杉木木板及别墅孕婴装修优选品牌 - 企业推荐官【官方】
  • BetterNCM安装器:3步搞定网易云音乐插件管理的专业工具
  • PHP周刊2026W25 | Laravel 13.15.0、Symfony 8.1、Laravel-Lang 供应链攻击、Laracon US 2026、PHP 生态普查
  • wechatapi二次开发过程,如何处理文件消息