当前位置: 首页 > news >正文

日本发布比肩Fable5的模型?Fugu Ultra初探!

今天一打开手机,看到了一条非常新鲜的消息!

听说日本发布了一款叫 Fugu Ultra 的模型,性能比肩 Fable 5 和 Mythos!

然后贴了这样一张图片:

从图片来看,确实很强的样子!!!

有些基准数据比 Mythos 和 Fable 5 都还要强!

编程能力比 Opus4.8 强,比 Fable 5 弱一些。

这数据非常亮眼啊。我从来没有听说过日本的模型,这次突然听到真是充满了好奇感!

然后我就查了一下资料:

Sakana AI 于2026 年 6 月 22 日正式发布了这款新产品。它的核心反差点在于:它不是又一个更大的基础模型,而是"一个被训练用来调度其他模型的模型"——一个指挥家(conductor)式的语言模型。

对外它表现得像一个普通模型:你调一个 API 端点就行;对内它是一整套多智能体编排系统。Fugu 自己会判断——简单问题直接答,复杂的多步骤任务就临时组建并协调一支"专家模型小队",模型选择、任务分派、结果验证、答案合成全部在内部完成,调用方的代码里完全看不到多智能体的复杂度。它甚至能递归调用自己。

这……这不就是一个“智能中转站”么?类似 OpenAI 不同模型的“内部路由”!那这个和 Mythos、Fable 5 去比,这不是搞笑么。

如果从对标 Mythos 的切入点来看确实有点搞笑,但是从它的卖点来看,确实也有点意思。

主要卖点

1. 单一 API,隐藏全部复杂度一个 OpenAI 兼容端点,把"多智能体系统"的麻烦事全部封装掉。你不用自己搭编排框架、不用管路由和调度。

2. 前沿性能,但不绑定单一厂商

官方称 Fugu Ultra 在工程、科学、推理等高难度基准上能和 Anthropic 的 Fable 5、Mythos Preview 等顶级模型"平起平坐",也声称在多项应用上超过 Gemini 3.1 Pro、Opus 4.8、GPT-5.5。(注意:这些是 Sakana 自己报告的数据,第三方对比基准之外的部分还需独立验证。)

3. "绕开供应链风险"

这是他们这次主打的最大叙事!底层模型池是可随时替换的。

如果某家供应商断供(他们直接点名了近期 Anthropic 的 Fable / Mythos 因出口管制而访问受限),Fugu 会动态绕路。他们把这个上升到"AI 主权(AI sovereignty)"的高度,主打给那些把 AI 用在关键基础设施、金融、政务上、不愿被单一厂商卡脖子的组织和国家。

4. 两个档位,按需选择

  • Fugu:性能与低延迟平衡,日常默认款,适合编程、代码审查、聊天机器人等交互场景;支持把特定 agent 移出池子以满足数据/隐私/合规要求。

  • Fugu Ultra:冲最高答案质量的硬核多步骤任务,调动更深的专家池。

5. 强在"长链条、脏活、累活"官方反复强调它的价值不在单条 prompt 答得多好,而在长跑——读、实现、测试、比对、找漏、出报告,能在很多步骤里持续推进。近 500 人的 beta 反馈集中在代码审查("别人指出 3 个 bug,它揪出 20 多个")、几乎全自动的数据科学研究、端到端安全评估,以及长会话里人格/角色稳定不漂移

6. 会自我进化因为靠的是"学习来的编排"而非写死的工作流,生态里出现更新更强的模型时,直接纳入 agent 池,收益顺带传给用户。

所以,从模型上来讲,这个东西没啥东西,但是从实用性的角度来看,好像确实可以。

它在官方 GitHub 上放了几个例子:

在这几类场景中,表现好像挺不错的!

其实对它的能力上限,我们已经基本上清楚了,最强的那个底层模型就是它的能力上限。接下来就看看价格了。

收费情况

收费方面它们提供了两种方式。一种是订阅制,一种是用多少付多少。

订阅制三档:Standard $20、Pro $100(10× 额度)、Max $200(20× 额度)/ 月,都含两个型号。

哇,这个价格和 Claude 的定价策略一模一样啊!

按量付费。Fugu Ultra(fugu-ultra-20260615)每百万 token:输入 $5 / 输出 $30 / 缓存输入 $0.50,上下文超 272K 翻倍。

2026 年 7 月底前订阅送第二个月免费。

这个 API 价格和 Opus4.8 比较接近,比 Fable 5 确实便宜很多。

如果它能给我把 Fable 5 配上,我觉得这个套餐价格和 API 价格确实也挺实惠的。

为此我还特地去它们官网观察了一下:

网页设计倒是挺简洁的!

官网也提供了 Chat 功能,我用谷歌账号登录,随便聊了一句:

然后也可以通过 API 接入:

这个 API 创建窗口,直接可以选择调用哪些模型!这个设计……这不妥妥的中转站啊!当然它是加了个专门的模型来进行智能调度,如果调度得好,确实可以既省成本,又能用上高性能模型。

它们现在是主打 Codex 接入,走 OpenAI 的协议:

export SAKANA_API_KEY={your api key} ​ curl -X POST https://api.sakana.ai/v1/chat/completions \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $SAKANA_API_KEY" \ -d '{"model":"fugu","messages":[{"role":"user","content":"How many r in word strawberry"}]}' ​ ​

我试了一下,在国内打开速度奇快,账单地址支持选中国!我好像有点心动了。

要不订阅一个月,测试一波?

主要还是看他们订阅套餐的配额怎么样,以及是否能够接入 Fable 等模型(估计没戏)!

这种调度系统最大的坑就是你压根不知道你调用的是什么模型。搞不好就是付了 Mythos 的钱,给你 Haiku 模型!打个形象的比喻就是:你点的是西施,它给你的是如花,灯下黑你也看不清楚

http://www.jsqmd.com/news/1072195/

相关文章:

  • 如何零成本解锁Wand专业版功能?开源增强工具为你提供完美解决方案
  • 用JDBC + AOP 实现的数据库加密切面能不能切西瓜?
  • 建议收藏!Wireshark 流量分析超详细例题精讲,零基础从入门到精通实战教程
  • 分布式时序数据库TimeLyre :原生多模态、高性能计算、快速时序回放分析
  • Meta SilverTorch 解读:为什么推荐系统要把索引也做成模型
  • 云原生可观测性体系构建:Prometheus + Grafana 全栈监控方案设计与落地
  • AI 辅助客服系统:情感分析驱动的智能邮件处理方案
  • 主流 Windows Hello 红外模组选型科普:传感器、IR 灯选购全指南
  • AI 营销自动化:从线索评分到转化优化的全链路实践
  • 小学期第六周学习笔记
  • 2026年京东云 618 活动 Hermes Agent/OpenClaw配置Token Plan搭建详细解读
  • 3D Web 开发实战:Three.js 场景构建与 GPU 渲染性能优化的工程化路径
  • Sexton Signata CT-5细胞治疗灌装系统解析:封闭式无菌灌装、GMP合规与CGT制剂生产选型指南
  • 5个步骤掌握HMCL:跨平台Minecraft启动器终极指南
  • 3分钟搞定Windows键盘重映射:让失灵按键重获新生的终极方案
  • VMware Workstation Pro 17 完整免费激活指南:1000+许可证密钥与简单教程
  • 计算机毕业设计之工厂员工办公用品订购管理系统
  • Python_40题详细解析
  • 2026深度实测|文科转码生vibe coding实战心得:零基础搞定Python课设与项目开发
  • DashScope Embedding工具类详解(向量转换、Milvus知识库项目实战)
  • Ansible:一台机器管所有服务器的自动化利器
  • 不用啃 SPSS 教程!Paperxie 一站式 AI 数据分析,搞定论文实证全流程
  • 异步消息管道:从 Redis Stream 到可靠消费的工程实践
  • GPU 租赁厂商量化排名:机房 PUE、隐性资费、训推工具实战对比
  • Blender到虚幻引擎一键迁移:5分钟完成3D资产无损转换的终极指南
  • 零门槛部署:2026年OpenClaw 云厂商 AI 智能体
  • 大气层整合包系统:解决Switch破解难题的终极完整指南
  • 如何为老旧Mac安装最新macOS:OpenCore Legacy Patcher终极指南
  • Boogu-Image - 闪电出图,产品图、海报、国风插画样样精通 一键整合包下载
  • VMware Workstation Pro 17:1000+许可证密钥与专业虚拟化环境搭建指南