当前位置: 首页 > news >正文

OpenAI 9 个月自研芯片 Jalapeño,推理成本砍半,ChatGPT 体验将大升级!

【导语:OpenAI 刚刚推出了自研芯片 Jalapeño,专为大模型推理设计。仅用 9 个月就完成开发,还借助 AI 设计芯片。这一突破将大幅降低推理成本,改变 ChatGPT 用户体验,也让 OpenAI 迈向全栈 AI 公司。】


9 个月刷新 ASIC 开发纪录

OpenAI 推出的自研芯片 Jalapeño,专为大模型推理设计。从 9 个月前的白纸一张,到如今工程样片跑通 GPT - 5.3 - Codex - Spark,且频率和功耗均达量产目标。通常先进半导体行业设计高性能 ASIC 需 18 到 24 个月,如 Google TPU 两年一代,Amazon Trainium 也类似,但 OpenAI 仅用 9 个月,刷新了先进半导体领域最快的 ASIC 开发周期。

AI 助力芯片设计

Jalapeño 更值得关注的是其设计方式,OpenAI 自家 AI 模型参与了芯片的设计和优化。AI 设计芯片并非新鲜事,Google 2021 年就用强化学习做芯片布局,速度比人类快几个数量级,此后 AlphaChip 连续优化了三代 TPU 布局方案。OpenAI 硬件团队掌门人 Richard Ho 来自这个圈子,他参与发明了 ML 设计芯片架构的方法。芯片设计中最耗时的验证环节需跑成千上万次,AI 擅长读历史设计数据、生成 RTL 代码、辅助验证和 debug、优化布局布线,替人扛掉了大部分磨人的工作。

推理成本降低,ChatGPT 体验升级

OpenAI 每年算力支出达百亿美元级别,这些成本最终由用户承担。Jalapeño 使推理成本砍半,普通用户最先能感受到响应变快,因为现在 ChatGPT 高峰期排队、转圈、长对话变慢本质是算力不够。推理效率提升后,同等服务器能服务更多用户。其次,免费版能力有望放开,现在很多功能锁在 Plus 里,成本降低后下放给免费用户的可能性增大。长远来看,月费不变但用户获得的能力可能翻几番。

OpenAI 迈向全栈 AI 公司

OpenAI 要做全栈 AI 公司,模型自己训,芯片自己设计,推理自己优化,部署自己控制。此前和 Cerebras 合作推理部署,让 OpenAI 摸清了专用推理硬件的价值。现在自己下场做,把经验变成可控平台。与 Apple 和 Google 不同的是,OpenAI 用 AI 加速 AI 基础设施建设,再用更好的基础设施跑更强的 AI。首批 GW 级数据中心将和 Microsoft 等合作方从 2026 年底开始部署。Jalapeño 只是第一代,未来值得期待。

编辑观点:OpenAI 自研芯片的突破意义重大,不仅提升了开发效率,还将改善用户体验,推动 AI 应用普及。其全栈 AI 模式有望形成良性循环,加速 AI 技术发展。

http://www.jsqmd.com/news/1083976/

相关文章:

  • 自动整形设备中的接近开关:让变形件回到标准位置
  • 从安装到调优,Strix Halo 本地大模型一周使用实录
  • C++跨平台(一):开发概述与策略选择
  • 终极指南:如何用ExtractorSharp高效编辑NPK游戏资源文件
  • 【Springboot毕设全套源码+文档】基于SpringBoot+Vue的学生交流互助平台的设计与实现(丰富项目+远程调试+讲解+定制)
  • 揭秘Wireshark:为什么它是全球第一的开源抓包工具?
  • 关于原客户业务部、产品管理部及生产厂人员划转的通知
  • 解决JSch SSH密钥格式不兼容:使用ssh-keygen生成PEM格式RSA密钥
  • Cesium 水波材质教程
  • 从蓝图到代码:UML 可视化建模新手完全指南
  • 合同系统智能化,让企业合同管理快人一步!
  • 告别网盘限速!九大平台直链下载助手完整指南
  • iOS网络安全实战:AFNetworking证书锁定防御中间人攻击
  • 在拼多多开了400单发票之后,我再也不用手机一个一个点了,因为我用ai开发了多多开票助手
  • Beta展开下广义Takagi函数的Hölder连续性分析
  • 什么是企业号码认证?
  • Gogs高危漏洞实战:从原理到修复的完整安全加固指南
  • 5分钟学会无损视频剪辑:LosslessCut零画质损失完整指南
  • 《赣州市本级政府投资数字化项目费用编制指南》(赣市财审字〔2026〕2号)标准解读
  • 想找重庆口碑好的会议音响服务商?哪家才是你的最佳之选?
  • 网页视频资源嗅探利器:猫抓浏览器扩展完全使用指南
  • 3大核心功能,让Windows文件管理效率提升300%:QTTabBar终极指南
  • 开源编程Agent来了,企业AI选型三大新命题 - 微元算力(weytoken)
  • 熟记特殊数字
  • QMCDecode终极指南:一键解锁QQ音乐加密音频的macOS音频处理神器
  • AI专著写作高效之道:借助AI工具,轻松打造20万字优质专著!
  • 路由---页面切换
  • [论文汇整-可用于综述或引言]AI Agent在不同行业的应用
  • 使用kaggle完成导游助手大项目
  • 程序员职业规划:一篇讲清核心用法