当前位置：首页 > news >正文

OpenAI 9 个月自研芯片 Jalapeño，推理成本砍半，ChatGPT 体验将大升级！

news 2026/6/26 22:12:18

【导语：OpenAI 刚刚推出了自研芯片 Jalapeño，专为大模型推理设计。仅用 9 个月就完成开发，还借助 AI 设计芯片。这一突破将大幅降低推理成本，改变 ChatGPT 用户体验，也让 OpenAI 迈向全栈 AI 公司。】

9 个月刷新 ASIC 开发纪录

OpenAI 推出的自研芯片 Jalapeño，专为大模型推理设计。从 9 个月前的白纸一张，到如今工程样片跑通 GPT - 5.3 - Codex - Spark，且频率和功耗均达量产目标。通常先进半导体行业设计高性能 ASIC 需 18 到 24 个月，如 Google TPU 两年一代，Amazon Trainium 也类似，但 OpenAI 仅用 9 个月，刷新了先进半导体领域最快的 ASIC 开发周期。

AI 助力芯片设计

Jalapeño 更值得关注的是其设计方式，OpenAI 自家 AI 模型参与了芯片的设计和优化。AI 设计芯片并非新鲜事，Google 2021 年就用强化学习做芯片布局，速度比人类快几个数量级，此后 AlphaChip 连续优化了三代 TPU 布局方案。OpenAI 硬件团队掌门人 Richard Ho 来自这个圈子，他参与发明了 ML 设计芯片架构的方法。芯片设计中最耗时的验证环节需跑成千上万次，AI 擅长读历史设计数据、生成 RTL 代码、辅助验证和 debug、优化布局布线，替人扛掉了大部分磨人的工作。

推理成本降低，ChatGPT 体验升级

OpenAI 每年算力支出达百亿美元级别，这些成本最终由用户承担。Jalapeño 使推理成本砍半，普通用户最先能感受到响应变快，因为现在 ChatGPT 高峰期排队、转圈、长对话变慢本质是算力不够。推理效率提升后，同等服务器能服务更多用户。其次，免费版能力有望放开，现在很多功能锁在 Plus 里，成本降低后下放给免费用户的可能性增大。长远来看，月费不变但用户获得的能力可能翻几番。

OpenAI 迈向全栈 AI 公司

OpenAI 要做全栈 AI 公司，模型自己训，芯片自己设计，推理自己优化，部署自己控制。此前和 Cerebras 合作推理部署，让 OpenAI 摸清了专用推理硬件的价值。现在自己下场做，把经验变成可控平台。与 Apple 和 Google 不同的是，OpenAI 用 AI 加速 AI 基础设施建设，再用更好的基础设施跑更强的 AI。首批 GW 级数据中心将和 Microsoft 等合作方从 2026 年底开始部署。Jalapeño 只是第一代，未来值得期待。

编辑观点：OpenAI 自研芯片的突破意义重大，不仅提升了开发效率，还将改善用户体验，推动 AI 应用普及。其全栈 AI 模式有望形成良性循环，加速 AI 技术发展。

查看全文

http://www.jsqmd.com/news/1083976/