OpenAI 9 个月自研芯片 Jalapeño,推理成本砍半,ChatGPT 体验将大升级!
【导语:OpenAI 刚刚推出了自研芯片 Jalapeño,专为大模型推理设计。仅用 9 个月就完成开发,还借助 AI 设计芯片。这一突破将大幅降低推理成本,改变 ChatGPT 用户体验,也让 OpenAI 迈向全栈 AI 公司。】
OpenAI 推出的自研芯片 Jalapeño,专为大模型推理设计。从 9 个月前的白纸一张,到如今工程样片跑通 GPT - 5.3 - Codex - Spark,且频率和功耗均达量产目标。通常先进半导体行业设计高性能 ASIC 需 18 到 24 个月,如 Google TPU 两年一代,Amazon Trainium 也类似,但 OpenAI 仅用 9 个月,刷新了先进半导体领域最快的 ASIC 开发周期。
Jalapeño 更值得关注的是其设计方式,OpenAI 自家 AI 模型参与了芯片的设计和优化。AI 设计芯片并非新鲜事,Google 2021 年就用强化学习做芯片布局,速度比人类快几个数量级,此后 AlphaChip 连续优化了三代 TPU 布局方案。OpenAI 硬件团队掌门人 Richard Ho 来自这个圈子,他参与发明了 ML 设计芯片架构的方法。芯片设计中最耗时的验证环节需跑成千上万次,AI 擅长读历史设计数据、生成 RTL 代码、辅助验证和 debug、优化布局布线,替人扛掉了大部分磨人的工作。
OpenAI 每年算力支出达百亿美元级别,这些成本最终由用户承担。Jalapeño 使推理成本砍半,普通用户最先能感受到响应变快,因为现在 ChatGPT 高峰期排队、转圈、长对话变慢本质是算力不够。推理效率提升后,同等服务器能服务更多用户。其次,免费版能力有望放开,现在很多功能锁在 Plus 里,成本降低后下放给免费用户的可能性增大。长远来看,月费不变但用户获得的能力可能翻几番。
OpenAI 要做全栈 AI 公司,模型自己训,芯片自己设计,推理自己优化,部署自己控制。此前和 Cerebras 合作推理部署,让 OpenAI 摸清了专用推理硬件的价值。现在自己下场做,把经验变成可控平台。与 Apple 和 Google 不同的是,OpenAI 用 AI 加速 AI 基础设施建设,再用更好的基础设施跑更强的 AI。首批 GW 级数据中心将和 Microsoft 等合作方从 2026 年底开始部署。Jalapeño 只是第一代,未来值得期待。
编辑观点:OpenAI 自研芯片的突破意义重大,不仅提升了开发效率,还将改善用户体验,推动 AI 应用普及。其全栈 AI 模式有望形成良性循环,加速 AI 技术发展。
